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这 是 一 本 学 习 材 料 ， 是 为 编程 “ 零 基 础 ”的 朋友 学 习 Python 提 供 的 类 
似 教材 的 学 习 材料 ， 所 以 ， 内 容 会 有 庞杂 琐碎 之 感 ， 但 这 对 于 “ 零 基 
础 ”的 读者 来 讲 是 不 可 缺少 的 。 所以， 不 要 把 这 本 书 当 作 “ 开 发 手册 ”来 
用 。 


本 书 昌 然 是 以 “ 零 基 础 起步， 但 是 并 不 打算 仅仅 涉及 一 些 浅显 的 入 
门 知 识 ， 当 然 基础 知识 是 必 不 可 少 的 ， 还 想 为 "“ 零 基 础 ”的 朋友 多 提供 一 
些 知识 ， 一 些 所 谓 高 级 的 内 容 ， 既 满足 了 好 奇 心 ， 也 可 以 顺势 深入 研 
完 。 当 然 ， 真 正 的 深入 还 需要 读者 目 己 努力 。 


“向 恨 上 帝 是 智慧 的 开端 >。 在 本 书 的 编写 过 程 中 ， 一 直 悍 和 狼 于 能 人 否 
所 言 无 误 ， 但 水 平 有 限 ， 错 误 难 免 ， 敬 请 读者 指出 ， 并 特别 建议 ， 对 有 
异议 的 地 方 ， 请 使 用 Google 网 站 搜索 更 多 的 资料 进行 比较 阅读 ， 也 可 以 
跟 我 联系 ， 共 同 探 讨 。 为 了 便于 进行 技术 交流 ， 我 创建 了 一 个 QQ 和 群 
( 群 号 : 26913719) ， 专 供 本 书 读者 研讨 技术 问题 。 


完成 本 书 是 一 个 比较 漫长 的 过 程 ， 在 这 个 过 程 中 ， 得 到 了 很 多 朋友 
的 帮助 ， 在 这 里 对 他 们 表示 感谢 ， 并 将 他 们 的 名 号 列 在 下 面 : 

李 航 、 令 狐 虫 、github641、dongm2ez、wdyggh、codexc、 
winecat、solarhell、ArtinHuang、 吴 优 。 

在 本 书 编辑 过 程 中 ， 电 子 工业 出 版 社 的 编辑 高 洪 霞 、 黄 爱 萍 为 本 书 
的 面世 做 出 了 极 大 的 努力 ， 对 她 们 的 工作 表示 诚挚 感谢 。 


最 后 ， 要 感谢 我 的 妻子 ， 在 本 书 的 写作 过 程 中 ， 她 给 了 我 很 多 喜 
励 ， 还 协助 我 检查 文本 内 容 。 














希望 这 本 书 能 够 为 有 意 学 习 Python 的 读者 提供 帮助 。 
齐 伟 
2016 年 1 月 


第 1 季 ”基础 


从 这 里 开始 ， 请 读者 一 一 你 已 经 确信 自己 是 要 学 习 Python 的 准 程序 
员 了 一 一 跟 我 一 起 ， 领 略 一 番 Python 的 基础 知识 ， 这 是 学 好 Python 的 起 
步 ， 同 时 ， 其 内 容 也 和 其 他 的 高 级 编程 语言 有 相通 之 处 。 所 以 ， 学 习 
Python 是 一 种 “性 价 比 ?非常 高 的 事情 。 


在 本 季 中 ， 要 问 读 者 介绍 Python 的 基本 对 象 类 型 、 语 法 规则 和 函数 
的 相关 知识 。 学 习 完 这 些 内 容 ， 就 能 够 用 Python 做 很 多 事情 了 ， 且 在 其 
中 还 会 不 断 强 化 一 种 掌握 Python 的 方法 。 








第 0 半 ”预备 





从 现在 开始 ， 本 书 将 带领 你 一 一 零 基础 的 学 习 者 一 一 进入 到 Python 
世界 。 进 入 这 个 世界 ， 你 不 仅 能 够 体会 到 Python 的 魅力 ， 感 受到 编程 的 
快乐 ， 还 顺便 可 以 成 为 一 个 程序 员 ， 我 相信 你 一 定 能 成 为 一 个 伟大 的 程 
序 员 ， 当 然 这 并 不 是 本 书 的 目的 ， 更 不 是 本 书 的 功 务 。 当 你 成 为 一 个 技 
术 大 牛 的 时 候 ， 最 应 该 感谢 的 是 你 的 父母 ， 如 果 你 顺便 也 感谢 一 下 本 
书 ， 比 如 多 购买 一 些 本 书 分 发 给 你 的 弟兄 们 ， 那 是 我 的 福 份 ， 感 激 不 


~、~o 


预备 ，Let’s go! 


0.1 关于 Python 的 故事 





学 习 一 种 编程 语言 是 一 件 很 有 意思 的 事情 ， 从 现在 开始 ， 我 就 和 你 
-起 来 学 习 一 种 叫 作 Python 的 编程 语言 。 


在 编程 界 ， 存 在 着 很 多 茶 种 语言 的 忠实 跟随 者 ， 因 为 忠实 ， 就 会 如 
同 卫 道士 一 样 有 了 维护 那 种 语言 采 誉 的 义务 ， 所 以 忌 见 到 有 人 争论 哪 种 
语言 好 、 哪 种 语言 不 好 。 当 然 ， 好 与 坏 的 标准 是 不 一 样 的 ， 有 些 人 以 学 
了 之 后 能 不 能 挣 大 钱 为 标准 ， 有 些 人 以 是 否 容易 学 为 标准 ， 或 许 还 有 人 
以 能 不 能 将 来 和 妹子 一 同 工 作 为 标准 (也 或 许 没 有 ) ， 甚 至 有 些 人 就 没 
有 什么 标准 ， 只 是 和 任 感 觉 或 者 道听途说 而 人 人云亦云 用 了 。 


读者 在 本 书 中 将 看 到 一 个 烦 为 迷恋 于 Python 的 人 ， 因 为 全 书 看 不 到 
一 句 有 关 Python 的 坏话 (如 果 有 ， 则 肯定 是 笔 识 ， 是 应 该 删除 的 部 
A 


不 管 是 语言 还 是 其 他 什么 ， 挑 缺点 是 比较 容易 的 事情 ， 但 找 优点 都 
是 困难 的 ， 所 以 ，《 攻 经 》 中 那 句 话 一 一 为 什么 你 看 见 弟兄 的 眼中 有 
刺 ， 却 不 想 自己 眼中 有 梁 木 呢 ? 征 值 得 我 们 牢记 的 。 


在 本 书 开始 就 废话 连篇 ， 显 见 本 书 不 会 有 什么 “干货 >”， 倒 是 “水 
货 ? 颇 多 ， 并 不 是 因为 “水 是 生命 的 源 录 ”， 而 是 因为 作者 水 平 有 限 ， 如 
果 不 迭 “ 水 ”， 唯 恐 说 不 清道 不 明 ， 还 敬 请 读者 谅解 。 嫌 “水 ”多 的 ， 就 此 
可 以 合 上 本 书 去 看 网 上 的 各 种 电影 吧 。 也 不 用 在 网 上 喷 我 ， 因 为 那样 只 
能 增加 更 多 的 “口水 ”( 还 是 水 ) 。 


下 面 说 点 儿 正 经 的 。 





























0.1.1 Python 的 昨天 、 今 天 和 明天 


这 个 题目 有 点 大 了 ， 似 乎 回顾 过 去 、 考 察 现 在 、 张 望 未 来 都 是 那些 
掌握 方 癌 的 大 人 物 做 的 。 那 就 让 我 们 每 个 人 都 成 为 大 人 物 吧 。 因 为 如 果 





不 回顾 一 下 历史 ， 似 乎 无 法 满足 好 奇 心 ;如 果 不 考 侍 一 下 现在 ， 也 不 放 
心 〈《 担 心 学 了 之 后 没有 什么 用 途 ) ; 如 果 不 张望 一 下 未 来 ， 怎 么 能 吸引 
(也 算是 一 种 忽悠 吧 〉 你 呢 ? 





1.Python 的 历史 


历史 回来 是 成 功 者 的 传记 ， 现 在 流传 的 关于 Python 的 历史 也 是 如 
此 。 


Python 的 创始 人 为 吉 多 : 范 罗 苏 姆 (Guido van Rossum) ， 关 于 他 开 
发 Python 的 过 程 ， 很 多 资料 里 面 都 要 记录 下 面 的 故事 : 


1989 年 的 圣诞 节 期 间 ， 天 多 : 范 罗 办 姆 为 了 在 阿姆斯特丹 打发 时 
间 ， 决 心 开 发 一 个 新 的 胸 打 解释 程序 作为 ABC 语 言 的 一 种 继承 。 之 所 
以 选中 Python 作 为 程序 的 名 字 ， 是 因为 他 古 一 个 壹 提 : 派 森 的 飞行 马戏 团 
的 爱好 者 。ABC 是 由 吉 多 参加 设计 的 一 种 教学 语言 ， 在 吉 多 本 人 看 来 ， 
ABC 这 种 语言 非常 优美 和 强大 ， 是 专门 为 非 专业 程序 员 设计 的 。 但 是 
0 完 其 原因 ， 评 多 认为 是 非 开 放 霹 成 的 。 百 多 决心 
人 一 错误 ， 并 取得 了 非常 好 的 效果 ， 完 美 结合 了 C 和 其 


这 个 故事 是 从 维基 百科 里 面 直 接 复制 过 来 的 ， 很 多 讲 Python 历 史 的 
资料 里 面 ， 也 都 转载 了 这 一 段 文字 。 但 是 ， 在 我 来 看 ， 训 多 是 为 了 “ 打 
发 时 间 ” 而 决定 开发 Python， 源 自 他 的 这 样 一 段 自述 : 

















Over six years ago, in December 1989, I was looking for 
a"hobby"programming project that would keep me occupied during the week 
around Christmas.My office (a government-run research lab in 
Amsterdam) would be closed, but1 had a home computer, and not much 
else on my hands.I decided to write an interpreter for the new scripting 
language I had been thinking about lately:a descendant of ABC that would 
appeal to Unix/C hackers.I chose Python as a working title for the project， 
being in a slightly irreverent mood (and abig fan of Monty Python's Flying 
Circus) .〈 原 文 地 址 : https://www.python.org/doc/essays/foreword/) 


首先 ， 必 须 承 认 ， 这 个 哥们 儿 是 一 个 非常 牛 的 人 ， 此 处 献上 茶 敬 的 


各 拜 。 


其 次 ， 刚 刚 开 始 学 习 Python 的 朋友 ， 可 千 万 别 认 为 Python 是 一 个 可 
以 随 随 便便 鼓 揭 的 东西 ， 人 家 也 是 站 在 巨人 的 肩膀 上 的 。 


第 三 ， 牛 人 在 成 功 之 后 ， 往 往 把 奋斗 的 过 程 描绘 得 比较 简单 。 或 者 
古 出 于 谦虚 ， 或 者 是 为 了 让 人 听 起 来 他 更 牛 。 反 正 ， 我 们 看 最 后 结果 的 
时 候 ， 很 难 感受 过 程 中 的 酸 甜 苗 辣 。 


不 管 怎样 ， 吉 多 : 范 罗 苏 姆 在 那 时 刻 创立 了 Python， 而 且 ， 更 牛 的 在 
于 他 具有 现代 化 的 思维 一 一 开放 ， 并 通过 Python 社 区 ， 吸 引 来 自 世 界 各 
地 的 开发 者 ， 参 与 Python 的 建设 。 在 这 里 ， 请 读者 一 定 要 联想 到 Linux 
和 它 的 创始 人 林 纳 斯 - 托 瓦 效 。 两 者 都 秉承 “开放 ”思想 ， 得 到 了 来 自 世 
界 各 地 开发 者 和 应 用 者 的 欢呼 和 章 敬 。 


请 读者 向 所 有 倡导 “开放 ”的 牛人 们 表示 敬意 ， 是 他 们 让 这 个 世界 变 
得 更 美好 ， 他 们 以 行动 诠释 了 热力 学 第 二 定律 一 一 “ 燃 增 原理 ”。 











2.Python 的 现在 


Python 现 在 越 来 越 火 了 ， 因 为 它 搭 上 了 “大 数据 *”“ 云 计算 ” “自然 
语言 处 理 ” 等 这 些 时 散 名 词 的 便 车 。 


网 上 时 第 会 有 一 些 编程 语言 排行 榜 之 类 的 东西 ， 有 的 初学 者 党 种 被 
排行 榜 所 迷惑 ， 总 想 要 学 习 排列 在 第 一 位 的 ， 认 为 排 在 第 一 位 的 编程 语 
言 需求 量 大 。 不 管 排行 榜 是 怎么 编制 的 ，Python 虽 然 没 有 登 上 状元 、 榜 
眼 、 探 花 之 位 ， 但 也 不 太 靠 后 呀 。 

另外 一 个 信息 ， 更 能 激动 一 下 初学 者 那里 脆弱 的 小 心脏 。 


Dice.com 了 网 上 对 20000 名 IT 专业 人 十 进行 调查 的 结果 显示 : Java 类 程 
序 员 平 均 工 资 91060 美 元 ，Python 类 程序 员 平 均 工 资 90208 美 元 。 


Python 程序 员 比 Java 程 序 员 的 平均 工资 低 ， 但 看 看 关 距 ， 再 看 看 两 
者 的 学 习 难 度 ， 学 习 Python 绝 对 是 一 个 性 价 比 非常 高 的 投资 。 


这 么 合算 的 编程 语言 不 学 等 待 何 时 ? 








3.Python 的 未 来 


Python 的 未 来 要 靠 读者 了 ， 你 学 好 了 、 用 好 了 ， 未 来 它 就 光明 了 ， 
它 的 未 来 在 你 手 里 。 如 图 0-1 所 示 为 Python 创 始 人 吉 多 : 范 罗 苏 姆 。 





0.1.2 ”Python 的 特点 





很 多 高 级 语言 都 宣称 自己 是 简单 的 、 入 门 容易 的 ， 并 且 上 共有 普 适 
性 ， 但 真正 能 做 到 这 些 的 ， 只 有 Python。 有 朋友 做 了 一 件 衬衫 ， 上 面 写 
者 “生命 有 限 ， 我 用 Python”， 这 说 明 什 么 ?说明 Python 有 着 简单 、 开 友 
速度 快 、 节 省 时 间 和 精力 的 特点 。 因 为 它 是 开放 的 ， 有 很 多 可 爱 的 开发 
者 《为 开放 社区 做 贡献 的 开发 者 是 最 可 爱 的 人 ) ， 将 常用 的 功能 做 好 了 
放 在 网 上 ， 谁 都 可 以 拿 过 来 使 用 。 这 就 是 Python， 这 就 是 开放 。 

















图 0-1 Python 创始 人 : 吉 多 : 范 罗 苏 姆 


茶 敬 地 抄录 来 自 《 维 基 百 科 》 的 描述 : 


Python 是 完全 面 癌 对 象 的 语言 ， 函 数 、 模 块 、 数 字 、 字 符 串 都 是 对 
象 ， 并 且 完 全 文 持 继承 、 重 载 、 派 生 、 多 继承 ， 有 益 于 增强 源 代 码 的 复 
用 性 。Python 文 持 重 载运 算 符 ， 因 此 也 文 持 泛 型 设计 。 相 对 于 Lisp 这 种 
传统 的 函数 式 编程 语言 ，Python 对 函数 式 设 计 只 提供 了 有 限 的 文 持 。 有 
两 个 标准 库 〈functools 和 itertools) 提供 了 Haskell 和 Standard ML 中 久 经 
考验 的 函数 式 程序 设计 工具 。 


虽然 Python 可 能 被 粗略 地 分 类 为 “脚本 语言 ”(Script Language) ， 
但 实际 上 一 些 大 规模 软件 开发 项 目 〈 例 如 Zope、Mnet、BitTorrent 及 
Google) 也 都 广泛 地 使 用 它 。Python 的 文 持 者 较 喜 欢 称 它 为 一 种 高 级 动 
态 编程 语言 ， 原 因 是 “脚本 语言 光 Z 指 仅 做 简单 程序 设计 任务 的 语言 ， 如 
shell script、VBScript 等 ， 但 其 只 能 处 理 简 单 任 务 的 编程 语言 ， 并 不 能 与 
Python 相提并论 。 


Python 本 吴 被 设计 为 可 扩充 的 ， 并 非 所 有 的 特性 和 功能 都 集成 到 语 
言 核 心 。Python 提 供 了 丰富 的 API 和 工具 ， 以 便 程序 员 能 够 轻松 地 使 用 
C、C++、Cython 来 编写 扩充 模块 。Python 编 译 絮 本 里 也 可 以 被 集成 到 
其 他 需要 脚本 语言 的 程序 内 。 因 此 ， 很 多 人 还 把 Python 作为 一 种 “胶水 
语言 ” (glue language) 使 用 ， 使 用 Python 将 其 他 语言 编写 的 程序 进行 集 
成 和 封装 。 在 Google 内 部 的 很 多 项 目 ， 例 如 Google Engine 使 用 C++ 编写 
性 能 要 求 极 高 的 部 分 ， 然 后 用 Python 或 Java/Go 调 用 相应 的 模块 。 

《Python 技术 手册 》 的 作者 马 特 利 〈Alex Martelli ) 说 : “2004 年 ， 
Python 已 在 Google 内 部 使 用 ，Google 招 募 许 多 Python 高 手 ， 但 在 这 之 前 
就 已 决定 使 用 Python。 他 们 的 目的 是 尽量 使 用 Python， 在 不 得 已 时 改 用 
C++; 在 操控 硬件 的 场合 使 用 C++， 在 快速 开发 时 使 用 Python。” 


可 能 这 里 面 有 一 些 术语 还 不 是 很 理解 ， 没 关系 ， 只 要 明白 : Python 
古 一 种 很 牛 的 语言 ， 应 用 简单 ， 功 能 强大 ，Google 都 在 使 用 ， 这 就 足够 
了 ， 足 够 让 你 下 决心 学 习 了 。 











0.1.3 Python 哲学 


Python 之 所 以 与 众 不 同 ， 还 在 于 和 它 强 调 一 种 哲学 理念 : 优雅 、 明 
有 一 段 许 歌 读 起 来 似乎 很 么 ， 但 真实 反映 了 Python 开发 者 的 
理念 : 


The Zen of Python 


Beautiful is better than ugly. 

Explicit is better than implicit. 

Simple is better than complex. 

Complex is better than complicated. 

Flat is better than nested. 

Sparse is better than dense. 

Readability counts. 

Special cases aren't special enough to break the rules. 

Although practicality beats purity. 

Errors should never pass silently. 

Unless explicitly silenced. 

In the face of ambiguity, refuse the temptation to guess. 

There should be one-- and preferably only one --obvious way to do it. 
Although that way may not be obvious at first unless you're Dutch. 
Now is better than never. 

Although never is often better than “ 


right” 


now. 
If the implementation is hard to explain, it's a bad idea. 

If the implementation is easy to explain, it may be a good idea. 
Namespaces are one honking great idea -- let's do more of those! 


网 上 能 够 看 到 这 段 文字 的 中 文 译本 ， 读 者 可 以 去 搜索 阅读 。 


0.2 ”从 小 工 到 专家 


这 个 标题 ， 我 借用 了 一 本 书 的 名 字 一 一 《程序 员 修 炼 之 道 ， 从 小 工 
到 专家 》， 并 在 此 特别 推荐 阅读 。 


“从 小 工 到 专家 ”也 是 很 多 刚 学 习 编 程 的 朋友 的 愿望 。 如 何 能 实现 
0 
议 得 借鉴 


有 一 个 学 习 Python 的 朋友 曾 问 我 :“ 书 已 经 看 了 ， 书 上 的 代码 也 运 
行 过 了 ， 习 题 也 能 解答 了 ， 但 是 还 不 知 如 何 开 发 一 个 真正 的 应 用 程序 ， 
不 知 从 何 处 下 手 ， 怎 么 办 ? ” 


另外 ， 也 遇 到 过 一 些 刚刚 毕业 的 大 学 生 ， 从 简历 上 看 ， 相 关 专 业 的 
考试 分 数 是 不 错 的 《我 一 般 相 信和 那些 成 绩 是 真 的 ) ， 但 是 ， 一 讨论 到 专 
业 问 题 ， 常 常 不 知 所 云 ， 特 别 是 当 让 他 面 对 真 实 的 工作 对 象 时 ， 表 现 出 
来 的 比 成 绩 单 差 太 多 了 。 


对 于 上 述 情况 ， 我 一 般 会 武断 地 下 一 个 结论 : 练 得 少 。 


要 从 小 工 成 长 为 专家 ， 必 经 之 路 是 要 多 阅读 代码 ， 多 调试 程序 。 古 
言 “ 拳 不 离 手 ， 曲 不 离 口 ?， 多 练习 是 成 为 专家 的 唯一 途径 。 

















0.2.1 零 基 础 


有 一 些 初学 者 ， 特 别 是 非 计算 机 专业 的 人 ， 担 心 自己 基础 差 ， 不 能 
学 好 Python。 诚 然 ， 在 计算 机 方面 的 基础 越 好 ， 对 学 习 任何 一 门 新 的 编 
程 语言 越 有 利 。 但 如 果 是 “绝对 零 基础 * 也 不 用 担心 ， 本 书 就 是 从 这 个 角 
度 切入 来 满足 你 的 需要 的 。 凡 事 总 得 有 一 个 开始 ， 那 么 就 让 本 书 成 为 你 
学 习 编 程 语言 的 开始 吧 。 


就 我 个 人 来 看 ，Python 是 比较 适合 作为 学 习 编 程 的 入 门 语言 的 。 











类 国有 不 少 高 校 也 这 么 认为 ， 他 们 纷纷 用 Python 作 为 编程 专业 甚至 
US 言 ， 如 图 0-2 所 示 为 美国 各 高 校 设立 的 编 
旦 语言 专业 。 


Number of top 39 U.S. computer science departments 
that use each language to teach introductory courses 


5 
. 轩 国 加 国 国 


Python Java MATLAB C++ Scheme Scratch 


Analysis e by Philip Guo (www.pgbovine .net) in July 2014 





图 0-2 美国 高 校 设立 的 编程 语言 专业 
总 而 言 之 ， 学 习 Python， 你 不 用 担心 基础 问题 。 




















0.2.2 ”阅读 代码 


有 人 句 话 说 得 好 : “读书 破 万 花 ， 下 笔 如 有 神 ”， 这 也 追 用 于 编程 。 
过 阅读 别人 的 代码 ,“ 站 在 巨人 的 屑 膀 上 ”， 让 目 己 眼界 开阔 ， 思 加 给 完 
3 


阅读 代码 的 最 好 地 方 就 是 : www.github.com。 


如 果 你 还 没有 账号 ， 请 尽快 注册 ， 它 将 是 你 成 为 一 个 优秀 程序 员 的 
起 点 。 当 然 ， 不 要 忘记 来 follow 我 ， 我 的 账号 是 : qiwsir。 

阅读 代码 最 好 的 方法 是 一 边 阅 读 、 一 边 进行 必要 的 注释 ， 这 样 可 以 
梳理 对 别人 代码 的 认识 。 然 后 可 以 run 一 下 ， 看 看 效果 。 当 然 ， 还 可 以 


按照 自己 的 设想 进行 必要 修改 ， 然 后 再 run。 经 过 几 轮 ， 束 可 以 将 别人 
的 代码 消化 吸收 了 。 


0.2.3 “调试 程序 





阅读 是 信息 的 吸收 过 程 ， 写 作 则 是 信息 的 加 工 输出 过 程 。 


要 目 己 动手 写 程序 。“ 一 万 小 时 定律 ?在 编程 领域 也 是 成 立 的 ， 除 非 
你 天 生 吏 是 天 才 ， 和 否则， 只 有 通过 “一 万 小 时 定律 ?才能 成 为 天 才 。 


在 调试 程序 的 时 候 ， 要 善于 应 用 网 络 ， 看 看 类 似 的 问题 别人 是 如 何 
解决 的 ， 不 要 仅 局 限于 目 己 的 思维 范围 。 利 用 网 络 就 少不了 使 用 搜索 引 
ee 

家 。 


我 不 相信 “三 天 擎 握 Python”“ 三 周 成 为 高 手 ” 之 类 的 让 人 听 起 来 热 
血 沸腾 、 懂 悍 无 限 的 骗 人 宣传 。 如 果 你 通过 本 书 跟 我 对 话 ， 至 少 说 明 你 
我 都 是 普通 人 人， 普通 人 要 做 好 一 件 事情 ， 除 了 "机缘 巧 合 " 遇 到 贯 人 之 
0 




















0.3 ”安装 Python 





任何 高 级 语言 都 需要 一 个 自己 的 编程 环境 ， 这 就 好 比 写 字 一 样 ， 需 
要 有 纸 和 笔 ， 在 计算 机 上 写 东 西 ， 也 需要 有 文字 处 理 软件 ， 比 如 各 种 名 
称 的 Office 类 软件 。 笔 和 纸 以 及 Office 软 件 ， 就 是 写 东 西 的 硬件 或 软件 ， 
总 之 ， 那 些 文字 只 能 写 在 相应 的 硬件 或 软件 上 ， 才 能 最 后 成 为 一 篇 文 
章 。 编 程 也 要 有 个 程序 之 类 的 东西 ， 把 代码 写 在 上 面 ， 才 能 形成 类 似 文 
章 那 样 的 文件 一 一 自己 编 的 程序 。 


阅读 本 书 的 零 基 础 朋友 ， 力 至 于 非 零 基础 的 朋友 ， 不 要 希望 在 这 里 
学 到 很 多 高 深 的 Python 语 言 技 巧 。 重 要 的 是 学 会 一 些 方 法 ， 比 如 刚才 给 
大 家 推荐 的 < 上 网 Google 一 下 *”， 束 是 非常 好 的 学 习 方 法 。 互 联网 的 伟大 
之 处 ， 不 仅仅 在 于 打 游 戏 、 看 看 养眼 的 照片 或 者 各 种 视频 之 类 的 ， 我 更 
心 硕 望 本 书 的 读者 不 仅仅 把 互联 网 当 作 娱乐 网 ， 还 要 当 作 知识 网 和 创造 
网 。 











扯 远 了 ， 拉 回来 。 在 学 习 过 程 中 ， 遇 到 一 点 点 疑问 都 不 要 放 过 ， 思 
考 、 艾 试 之 后 ， 不 管 有 没有 结果 ， 孝 要 Google 一 下 ， 当 然 ， 要 做 到 这 一 
点 ， 需 要 有 点 技术 ， 这 点 技术 对 于 立志 于 成 为 编程 专家 的 读者 来 说 是 必 
ee 

: 零 基础 。 


《 必 邪 剑 谱 》 和 《 获 花 宝典 》 这 两 本 盖世 武功 秘籍 ， 对 练功 者 提出 
了 一 个 较 高 的 要 求 : 和 欲 练 神 功 ， 挥 刀 目 宫 。 


学 Python， 如 果 要 达到 比较 高 的 水 平 ， 其 实 不 用 自 宫 〈 如 果 读 者 真 
的 要 以 此 明志 ， 该 行为 结果 与 本 书 的 作者 和 出 版 机 构 无 关 ， 纯 属 个 人 行 
为 。 若 读者 尚未 成 年 ， 请 在 法 定 监护 人 的 监护 下 阅读 本 书 ， 特 此 声 
明 ) 。 但 是 ， 需 要 在 你 的 计算 机 中 安装 一 些 东西 ， 并 且 这 个 过 程 有 时 比 
较 耗 费时 间 。 


所 需要 安装 的 东西 ， 都 在 这 个 页 面 里 面 : 


www.python.org/downloads/。 











www.python.org 是 Python 的 官方 网 站 ， 如 末 你 的 英语 非常 好 ， 那 么 
阅读 该 网 站 ， 可 以 获得 非常 多 的 收获 。 


在 下 载 页 面 里 面 ， 显 示 出 Python 目前 有 两 大 版 本 : Python 3.x.x 和 和 
Python 2.7.x。 可 以 说 ，Python 3 是 未 来 ， 它 比 Python 2.7 有 进步 。 但 是 ， 
现在 还 有 一 些 东 西 没 有 完全 兼容 Python 3， 所 以 ， 本 书 在 讲解 中 以 
Python 2.7 为 主 ， 茹 顾 Python 3.x。 一 般 而 言 ， 如 果 学 了 Python 2.7， 再 学 
习 Python 3 就 很 容易 ， 因 为 两 者 只 是 某 些 地 方 的 变化 。 请 读者 不 要 纠结 
于 是 学 习 Python 2 还 是 学 习 Python 3 这 种 无 聊 的 问题 ， 如 果 两 个 差别 达到 
让 你 学 了 而 这 个 无 法 使 用 那个 ， 这 将 是 Python 的 灾难 。 绝 顶 聪 明 的 
Python 创造 者 和 维护 者 们 ， 绝 对 不 会 允许 这 样 的 事情 出 现 。 























0.3.1 Ubuntu 系统 


你 的 计算 机 是 什么 操作 系统 的 ? 如 果 是 Linux 的 某 个 发 行 版 ， 比 如 
Ubuntu， 那 么 就 跟 我 同道 了 。 如 果 是 i0S， 也 一 样 ， 因 为 都 是 UNIX 磨 下 
的 ， 与 在 Ubuntu 中 的 安装 过 程 大 同 小 异 。 只 是 Widows 有 点 另类 了 。 


但 没关系 ，Python 就 是 器 平台 的 ， 它 可 以 在 任何 系统 下 进行 编程 ， 
用 它 写 出 来 的 程序 也 可 以 运行 在 任何 操作 系统 中 。 


但 是 ， 我 个 人 推荐 使 用 Linux/UNIX 系 列 的 操作 系统 。 
正常 情况 下 ， 只 要 安装 了 Ubuntu 这 个 操作 系统 ， 就 已 经 安装 好 了 


Python 的 编程 环境 。 你 只 需要 打开 Shell， 然 后 输入 Python， 单 击 “ 回 
车 ”之 后 就 会 看 到 如 下 内 容 : 














$ python 

Python 2.7.6 (default, Nov 13 2013, 19:24:16) 

[GCC 4.6.3] on linux2 

Type "help", "copyright", "credits" or "license" for more information. 
>>> 


如 末 没 有 该 编程 环境 ， 就 需要 安 汶 了， 一 种 最 简单 的 方法 : 


$ sudo apt-get install python 





还 有 另外 一 种 比较 矿 烦 的 方法 ， 但 似乎 能 炫耀 一 下 目 己 的 水 平 ， 方 


法 如 下 。 
(1) 到 官方 网 站 下 载 源码 。 比 如 : 


wget http://www.python.org/ftp/python/2.7.8/Python-2.7.8.tgz 


(2) 解压 源码 包 


tar -zxvf Python-2.7.8.tgz 
(3) 编译 


cd Python-2.7.8 ./configure --prefix=/usr/local 
make&&sudo make install 


这 里 指定 了 安装 目录 /usr/local。 如 果 不 指 定 ， 可 以 使 用 默认 的 ， 直 
接 运 行 .jconfigure 即 可 。 


安装 好 之 后 ， 进 入 Shell， 输 入 Python， 就 会 看 到 结果 。 我 们 将 那个 
带 有 “>>>” 的 界面 称 之 为 "Python 的 交互 模式 ”。 


0.3.2 Windows 系 统 
到 下 载 页 面 里 找到 Windows 安 装 包 下 载 ， 比 如 下 载 了 这 个 文件 : 


python-2.7.8.msi。 然 后 完成 安装 。 


特别 注意 ， 安 装 完 之 后 ， 需 要 检查 系统 环境 变量 是 否 有 Python， 如 
果 没 有 ， 就 设置 一 下 。 


以 上 搞定 后 ， 在 cmd 中 ， 输 入 “python”， 得 到 与 前 面 类 似 的 结 
就 说 明 已 经 安装 好 了 。 








0.3.3” Mac OS 久 系 统 


其 实 根 本 就 不 用 再 写 怎么 安装 Mac OS X 系 统 了 ， 因 为 用 Mac OS Xx 











的 朋友 ， 肯 定 是 高 手中 的 高 高 手 了 ， 至 少 我 一 直 很 敬佩 那些 用 Mac OS 
X 并 坚持 没有 更 换 为 Windows 的 人 。 


所 笠 的 是 用 芋 果 电脑 的 就 不 用 安装 了 ， 因 为 里 面 一 定 预 装 好 了 ， 拿 
过 来 就 可 以 直接 用 。 


如 果 按 照 以 上 方法 顺利 安装 成 功 ， 只 能 说 明 辛 运 。 如 果 没 有 安装 成 
功 ， 则 是 提高 自己 的 绝 佳 机 会 ， 因 为 只 有 遇 到 问题 才能 解决 问题 ， 才 能 
知道 更 深刻 的 道理 ， 不 要 怕 ， 使 用 Google， 它 能 帮助 你 解决 问题 。 当 
然 ， 也 可 以 加 入 QQ 群 或 者 通过 微 博 问 我 。 





0.4 集成 开发 环境 (IDE) 


安装 好 Python 之 后 ， 束 可 以 进行 开发 了 。 按 照 惯例 ， 第 一 行 代码 总 
是 : Hello World。 


0.4.1 ”值得 纪念 的 时 刻 : Hello world 


不 管 你 使 用 的 是 什么 操作 系统 ， 总 之 肯定 能 够 找到 一 个 地 方 运行 
Python， 进 入 到 交互 模式 ， 像 下 面 一 样 : 


Python 2.7.6 (default, Nov 13 2013, 19:24:16) 

[GCC 4.6.3] on linux2 

Type "help", "copyright", "credits" or "license" for more information. 
>>> 


在 “>>>” 后 面 输入 print"Hello，World"， 并 按 回 车 键 ， 下 面 是 见证 奇 
迹 的 时 刻 。 


>>> print "Hello, World" 
Hello, World 


如 果 你 从 来 不 慌 编 程 ， 那 么 从 这 一 刻 起 ， 就 跨 入 了 程序 员 行 列 ， 如 
果 已 经 是 程序 员 ， 那 么 就 温习 一 下 当初 的 慰 早 吧 ! 


“Hello，World”" 是 你 用 代码 同 这 个 世界 打招呼 了 。 


每 个 程序 员 ， 都 曾经 经 历 过 这 个 伟大 时 刻 ， 不 经 历 这 个 伟大 时 刻 的 
程序 员 不 是 伟大 的 程序 员 。 为 了 纪念 这 个 伟大 时 刻 ， 理 解 其 伟大 之 所 
在 ， 下 面 执行 分 解 动作 : 


说 明 : 在 下 面 的 分 解 动作 中 ， 用 到 了 符号 做 ， 这 个 符 写 在 Python 
编程 中 表示 注释 。 所 谓 注释 ， 束 是 在 计算 机 中 不 执行 那 句 话 ， 只 是 为 了 
说 明 某 行 语 句 表达 什么 意思 ， 是 给 计算 机 前 面 的 人 看 的 。 特 别提 醒 ， 在 

















编程 实践 中 ， 注 释 是 必须 的 ， 尽 省 很 多 人 要 求 代 码 要 具有 可 读 性 ， 但 必 
要 的 注释 也 是 少不了 的 。 请 牢记 : 程序 在 大 多 数 情况 下 是 给 人 看 的 ， 只 
是 偶尔 让 计算 机 执行 一 下 。 


# 看 到 “>>>” 符 写 ， 表 示 Python 做 好 了 准备 ， 等 得 你 同 它 发 出 指令 ， 
让 它 做 事情 。 





>>> 


#print， 意 思 是 打印 。 在 这 里 也 是 这 个 意思 ， 是 要 求 Python 打 印 东 
西 。 


>>> print 





#"Hello,World" 是 打印 的 内 容 ， 注 意 ， 双 引 写 是 英文 状态 下 的 。 引 
号 不 是 打印 内 容 ， 它 相当 于 一 个 包 里 ， 把 打印 的 内 容 包 起 来 ， 统 一 交 给 
Python 。 


>>> print "Hello, World" 


# 上 而 命令 执行 的 结果 。Python 接 收 到 你 要 求 它 所 做 的 事情 : 打印 
Hello,World， 于 是 它 就 老 老 实 实地 执行 这 个 命令 ， 丝 坚 不 走样 。 


Hello, World 


在 Python 中 ， 如 末 进 入 了 上 面 的 样式 ， 残 是 进入 了 “交互 模式 ”。 这 
古 非常 有 用 而 且 简单 的 模式 ， 便 于 我 们 进行 各 种 学 习 和 探索 ， 随 肴 学 习 
的 深入 ， 你 将 更 加 觉得 它 魅力 四 里。 


笑 一 笑 : 有 一 个 程序 员 ， 感 觉 自 己 书法 太 烂 了 ， 于 是 立志 继承 光荣 
文化 传统 ， 购 买 了 笔墨 纸 砚 。 在 某 天 开始 练 字 ， 将 纸 铺 好 ， 拿 起 笔 芯 足 
墨水 ， 挥 至 在 纸 上 写 下 了 两 个 大 字 : Hello World。 


虽然 进入 了 程序 员 序 列 ， 但 是 ， 如 果 程 序 员 用 这 个 工具 仅仅 是 打 
印 “*Hello，World”， 又 怎 能 用 “伟大 ”来 形容 呢 ? 况且 这 个 工具 也 太 简 陋 
了 。 你 看 美工 妹妹 用 的 Photoshop， 行 政 妹妹 用 的 Word， 出 纳 妹妹 用 的 
Excel， 就 连坐 在 老板 更 后 面 的 那个 家 伙 也 在 用 PPT 播 放 目 己 都 不 相信 的 
新 理念 呢 ， 难 道 我 们 伟大 的 程序 员 ， 束 用 这 么 简陋 的 工具 来 号 旷世 代码 


吗 ? 


当然 不 是 。 软 件 是 谁 开发 的 ? 程序 员 。 程 序 员 肯 定 
好 用 的 工具 ， 这 也 叫 作 “近水楼台 先 得 月 ”。 


IDE 就 是 程序 员 的 工具 。 





让 


先 为 自己 打造 





0.4.2 ”集成 开发 环境 概述 


IDE 的 全 称 是 : Integrated Development Environment， 简 称 IDE， 也 
称 为 ntegration Design Environment 或 Integration Debugging 
Environment， 翻 译 成 中 文 叫 作 “和 集成 开发 环境 *"， 它 是 一 种 辅助 程序 员 开 
发 用 的 应 用 软件 。 


维基 百科 这 样 对 IDE 定 义 : 


IDE 通 常 包括 程序 语言 编辑 器 、 自 动 建立 工具 和 除 错 器 。 有 些 IDE 
包含 编译 程序 和 直译 器 ， 如 微软 的 Microsoft Visual Studio， 有 些 则 不 包 
含 ， 如 Edlipse、SharpDevelop 等 ， 这 些 IDE 是 通过 调用 第 三 方 编译 器 来 
实现 代码 的 编译 工作 的 。 有 时 IDE 还 会 包含 版 本 控制 系统 和 一 些 可 以 设 
计 图 形 用 户 界 面 的 工具 。 许 多 支持 面 同 对 象 的 现代 化 IDE 还 包括 类 别 浏 
故 器 、 对 象 查 看 器 、 对 象 结构 图 。 虽 然 目前 有 一 些 IDE 文 持 多 种 程序 语 

于 《例如 Eclipse、 NetBeans、Microsoft Visual Studio) ， 但 是 一 般 而 
言 ， 主 要 还 是 针对 特定 的 程序 语言 而 量 身 打造 (例如 Visual Basic) 。 








如 图 0-3 所 示 是 微软 提供 的 名 字 叫 作 Microsoft Visual Studio 的 IDE， 
用 C# 进 行 编程 的 程序 员 都 用 它 。 
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图 0-3 ”名 叫 Microsoft Visual Studio 的 IDE 
如 图 0-4 所 示 是 在 苹果 电脑 中 出 现 的 名 叫 XCode 的 IDE。 
要 想 了 解 更 多 IDE 的 信息 ， 推 荐 阅读 维基 百科 中 的 词 条 。 


。 英文 词 条 : Integrated development environment 


。 中 文 词 条 : 集成 开发 环境 
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图 0-4 ”名 叫 XCode 的 IDE 


0.4.3 Python 的 IDE 


用 Google 搜 索 一 下 : Python IDE， 会 发 现 能 够 进行 Python 编程 的 IDE 
还 真 不 少 。 东 西 一 多 就 容易 无 所 适 从 ， 所 以 有 不 少 人 都 问 用 哪个 IDE 
好 。 可 以 看 看 下 面 链接 里 的 内 容 : 


http://stackoverflow.com/questions/81584/what-ide-to-use-for-python。 


顺便 推荐 一 个 非常 好 的 与 开发 相关 的 网 站 : stackoverflow.com。 在 
这 里 可 以 提问 ， 可 以 查看 答案 。 如 果 有 问题 ， 一 般 先 在 这 里 查找 ， 大 多 
数 情况 都 能 找到 非常 满意 的 结果 ， 且 有 很 大 局 发 。 


那么 作为 零 基 础 的 学 习 者 ， 用 哪个 IDE 好 呢 ? 既然 是 零 基 础 ， 就 别 
瞎 折 膳 了， 就 用 Python 自 带 的 IDLE， 原 因 就 是 : 简单 ， 虽 然 它 比较 简 
陋 。 











在 Windows 中 ， 通 过 “开始 ” 深 单 ~ “所 有 程序 ” “Python 
2.x”-, “JDLE (Python GUI) ”来 启动 IDLE。 启 动 之 后 ， 看 到 如 图 0-5 所 
示 的 界面 。 


Xx Python Shell 


File Edit Debug Options Windows Help 
{GCC 4.6.3 
Tvpe "copy ) ore information 


.3 (default, Feb 27 2014, 20:00:17) 








图 0-5 IDLE 界面 


注意 : 硝 看 到 的 界面 显示 版 本 与 这 个 图 不 同 ， 则 说 明和 安装 的 版 本 不 
同 ， 但 大 人 致 模样 差不多 。 


人 系统 的 用 户 ， 也 都 能 在 启动 IDLE 这 个 程序 之 后 ， 出 现 与 











上 面 





这 里 其 实 是 Python 的 交互 模式 编程 环境 。 


当然 还 有 一 个 文本 环境 ， 读 者 可 以 在 File 沫 单 中 新 建 一 个 文件 ， 即 
进入 文本 编辑 环境。 


除了 这 个 目 剖 的 IDE， 还 有 很 多 其 他 的 IDE， 列 出 来 ， 供 喜欢 折腾 
的 朋友 参考 。 


。 PythonWin: 是 Python Win32 Extensions 〈 半 官方 性 质 的 Python for 
win32 增 强 包 ) 的 一 部 分 ， 也 包含 在 ActivePython 的 Windows 发 行 版 
中 。 如 其 名 字 所 言 ， 只 针对 Win32 平 台 。 

。 MacPython IDE: MacPythonIDE 是 Python 的 Mac OS 发 行 版 内 置 的 
IDE， 可 以 看 作 是 PythonWin 的 Mac 对 应 版 本 ， 由 Guido 的 哥哥 Just 
van Rossum 编 写 。 

。 Emacs 和 Vim: Emacs 和 Vim 号 称 是 这 个 星球 上 最 强大 的 文本 编辑 








器 ， 对 于 许多 程序 员 来 说 是 万 能 IDE 的 不 二 选择 。 

。 Eclipse+PyDev: Eclipse 是 新 一 代 的 优秀 泛 用 型 IDE， 虽 然 是 基于 
Java 技 术 开 发 的 ， 但 出 色 的 架构 使 其 具有 不 进 于 Emacs 和 Vim 的 可 
扩展 性 ， 现 在 已 经 成 为 了 许多 程序 员 最 爱 的 瑞士 军刀 。 


磨 刀 不 误 砍 荣 工 ，IDE 已 经 有 了 ， 伟 大 程序 员 就 要 开始 从 事 伟大 的 
编程 工作 了 。 











第 1 章 ”基本 的 对 象 类 型 


在 Python 中 , “万 物 皆 对 象 ”， 在 一 开始 就 这 么 提出 来 ， 如 果 你 没有 
理解 ， 也 不 用 为 此 吃 不 好 、 睡 不 好 ， 就 当 听 了 一 个 新 名 词 ， 因 为 对 
于 “对 象 ” 的 理解 ， 可 以 说 要 贯穿 全 书 ， 甚 至 贯穿 你 的 代码 生涯 。 随 着 实 
践 的 增多 ， 对 于 “万 物 皆 对 象 "的 领悟 会 逐渐 深化 。 


什么 是 对 象 ? 现在 暂时 不 给 出 定义 ， 一 定 要 等 到 时 机 成 熟 的 时 候 给 
出 定义 才能 理解 。 


如 有 要 准确 描述 Python 对 象 ， 需 要 从 “号 份 、 类 型 、 值 ”三 个 维度 来 
描述 ， 这 三 个 维度 也 构成 了 一 个 对 象 的 特征 。 人 至 于 怎样 从 上 述 三 个 维度 
来 描述 对 象 ， 本 章 将 以 Python 中 基本 的 对 象 类 型 为 例 进行 说 明 。 如 宋 换 
一 种 说 法 ， 也 可 以 理解 为 本 半 将 带领 你 了 解 Python 中 的 某 些 常 用 的 和 基 
本 类 型 的 对 象 。 
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现在 更 多 人 把 计算 机 叫 作 电脑 ， 英 文 是 Computer。 只 要 提 到 它 ， 普 
Sn 甚至 乘 方 、 开 方 等 各 种 数学 运 


有 一 篇 名 为 《计算 机 前 世 》 的 文章 (参见 : 
http:/www.flickering.cn) ， 这 样 讲 到 : 


先 来 看 看 计算 机 (“Computer〉 这 个 词 是 怎么 来 的 。 贡 文学 得 好 的 小 
伙伴 看 到 Computer， 第 一 反应 是 : “compute-er”"， 应 该 是 个 什么 样 的 人 
吧 ， 对 , “做 计算 的 人 ”。 叮 歇 ! 恭喜 你 答对 了 。 最 先 被 命名 为 Compnuter 
的 确实 是 人 。 也 就 是 说 ， 电 子 计算 机 与 早期 的 机 械 计算 机 〉 被 赋予 这 
个 名 字 是 因为 他 们 执行 的 是 被 分 配 到 的 人 的 工作 。“ 计 算 机 ”原来 是 工作 
岗位 ， 它 被 用 来 定义 一 个 工种 ， 其 任务 是 执行 计算 ， 诸 如 导航 表 、 潮 汐 
图 表 、 天 文 历 书 和 行星 的 位 置 要 求 等 的 重复 计算 ， 从 事 这 个 工作 的 人 就 
是 Computer， 而 且 大 多 是 女神 。 


原文 还 附 有 如 图 1-1 所 示 的 图 片 。 


所 以 ， 以 后 要 用 第 三 人 称 来 称呼 Computer， 请 用 She (她 ) 。 现 在 
你 明白 为 什么 程序 员 中 那么 多 “他 ”了 吧 ， 因 为 Compnuter 是 “她 ”。 

















1-1 从 事 Computer 工 作 的 人 


1.1.1 数字 


在 Python 中 ， 对 数 的 规定 比较 简单 ， 达 到 了 小 学 数学 水 平 即 可 理 
年 。 


首先 ， 进 入 到 Python 的 交互 模式 中 ， 不 管 是 什么 操作 系统 ， 相 信 你 
总 能 找到 那个 交互 模式 。 然 后 模仿 下 面 的 操作 : 


>>> 3 

3 

>>> 3333333333333333333333333333333333333333 
3333333333333333333333333333333333333333L 
>>> 3.222222 

3.222222 


在 交互 模式 下 ， 如 果 输 入 3， 就 显示 了 3， 这 样 的 数 称 为 整数 ， 这 个 
称呼 和 小 学 数学 一 样 。 


当 输入 一 个 比较 大 的 整数 时 ，Python 会 自动 将 这 个 大 整数 进行 转 
换 ， 转 换 的 结果 是 一 个 “长 整数 ”类 型 ， 为 了 表示 它 ， 会 在 其 末尾 显示 一 


个 L。 由 于 这 个 操作 是 Python 自动 完成 的 ， 所 以 在 现在 的 Python 中 ， 没 
有 单独 将 “长 整数 "作为 一 个 类 型 。 


3.222222 在 数学 里 面 称 为 小 数 ， 这 里 依然 可 以 这 么 称呼 ， 不 过 就 像 
很 多 编程 语言 一 样 ， 习 惯 称 之 为 “浮上 点数 "”。 至 于 这 个 名 称 的 由 来 ， 也 是 
有 点 说 道 的 ， 有 兴趣 可 以 搜索 一 下 。 


上 述 举例 中 都 无 符号 《或 者 说 是 非 负数 ) ， 如 果 要 表示 负数 ， 跟 数 
学 中 的 表示 方法 一 样 ， 前 面 填 上 负 号 即 可 。 
值得 注意 的 是 ， 我 们 这 里 说 的 都 是 十 进 制 的 数 。 


除了 十 进 制 ， 还 有 二 进 制 、 八 进 制 、 十 六 进 制 都 是 在 编程 中 可 能 
到 的 ， 这 些 知识 不 作为 本 书 讲解 的 内 容 ， 读 者 要 了 解 ， 可 以 寻找 相关 书 
籍 ， 或 者 去 网 上 搜索 。 


每 个 数字 在 Python 中 都 是 一 个 对 象 ， 比 如 前 面 输入 的 3 束 是 一 个 对 
象 。 每 个 对 象 ， 在 内 存 中 都 有 自己 的 一 个 地 址 ， 这 就 是 它 的 身份 。 








>>> id(3) 
140574872 

>>> id(3.222222) 
140612356 

>>> id(3.0 
140612356 

>>> 





用 内 建 函 数 id0 可 以 查看 每 个 对 象 的 内 存 地 址 ， 即 里 份 。 


内 建 函 数 ， 英 文 为 built-in Function， 读 者 根据 名 字 也 能 猜 个 八 九 不 
离 十 了 。 不 错 ， 束 是 Python 中 已 经 定义 好 的 内 部 函数 。 


以 上 三 个 不 同 的 数字 是 三 个 不 同 的 对 象 ， 具 有 三 个 不 同 的 内 存 地 
此 ， 特 别 要 注意 ， 在 数学 上 ，3 和 3.0 是 相等 的 ， 但 是 在 这 里 ， 它 们 是 不 
同 的 对 象 。 


用 id0 得 到 的 内 存 地 址 是 只 读 的 ， 不 能 修改 。 


了 解 了 “身份 ”， 再 来 看 “类 型 >， 也 有 一 个 内 建 函 数 供 使 用 ， 即 
typeQ)。 


>>> type(3) 
<type 'int'> 

>>> type(3.0) 
<type 'float'> 
>>> type(3.222222) 
<type 'float'> 


<type'int'> 说 明 3 是 整数 类 型 (Interger) ; <type‘float*> 则 告诉 我 们 
该 对 象 是 浮 点 型 (Floating point real number) 。 与 id0 的 结果 类 似 ， 
typeO 得 到 的 结果 也 是 只 读 的 。 

至 于 对 象 的 值 ， 在 这 里 就 是 对 象 本 和 刁 了 。 

看 来 对 象 也 不 难 理解 。 

请 保持 上 自信， 继续 。 





1.1.2 ”变量 


仅仅 写 出 “3、4、5” 是 远 远 不 够 的 ， 在 编程 中 ， 经 常 要 用 到 “ 变 
量 ” 和 “ 数 ”〈 严 格 来 讲 是 对 象 ) 建立 起 对 应 关系 。 例 如 : 


>>> X 二 5 
>>> x 

5 

>>> x=6 
>>> Xx 


6 


在 这 个 例子 中 ，x=5 就 是 在 变量 x 和 数 5 之 间 建 立 了 对 应 关系 ， 接 着 
又 建立 了 x 与 6 之 间 的 对 应 关系 。 我 们 可 以 看 到 ，x 先 “是 5， 后 
来 “是 ”6。 


在 Python 中 ， 有 这 样 一 句 话 是 非常 重要 的 : 对 象 有 类 型 ， 变 量 无 类 
型 。 和 您 么 理解 呢 ? 


对 象 的 类 型 ， 可 以 使 用 type(0 来 查看， 前 面 已 经 演示 了 。 


当 在 Python 中 写 入 了 5、6，Computer 就 自动 在 其 内 存 中 某 个 地 方 建 
并 了 这 两 个 对 象 ， 就 好 比 建造 了 两 个 雕塑 ， 一 个 形状 似 5， 一 个 形状 似 











6， 这 两 个 对 象 的 类 型 就 是 Int. 


那个 x 就 好 比 是 一 个 标签 ， 当 x=5 时 ， 就 是 将 x 这 个 标签 挫 在 了 5 上 ， 
通过 这 个 x， 就 顺延 看 到 了 5， 于 是 在 交互 模式 中 ， “>>>x” 输 出 的 结果 就 
是 5， 给 人 的 感觉 似乎 是 x 就 是 5， 而 事实 是 x 这 个 标签 贴 在 5 上 面 。 同 样 
的 道理 ， 当 x=6 时 ， 标 签 就 换 位 置 了 ， 贴 到 6 上 面 。 


所 以 ， 这 个 标签 x 没有 类 型 之 说 ， 它 不 仅 可 以 贴 在 整数 类 型 的 对 象 
上 ， 还 能 贴 在 其 他 类 型 的 对 象 上 ， 比 如 后 面 会 介绍 到 的 str (字符 串 〉 类 
型 的 对 象 等 。 


Python 中 变量 的 这 个 特点 《〈“ 即 可 以 四 处 乱 贴 的 标签 ) 非常 重要 ， 它 
没有 类 型 。 





1.1.3 简单 的 四 则 运算 


读者 可 以 在 交互 模式 中 复习 一 下 小 学 数学 中 的 四 则 和 运算， 并且 报告 
给 你 小 学 数学 老师 ， 他 《她 ) 当初 效 费 知心 的 教育 成 果 在 这 里 得 到 了 应 
用 ， 








>>> 2+5 


>>> 10/5+1 


>>> 2*3-4 
2 


上 面 的 运算 中 ， 分 别 涉及 四 个 运算 符号 : 加 (+) 、 减 (-) 、 乘 
) 、 除 〈/) 


另外 ， 我 相信 读者 已 经 及 现 了 一 个 重要 的 公理 : 
计算 机 中 的 四 则 运算 和 小 学 数学 中 学 习 过 的 四 则 运算 规则 是 一 样 的 




















要 不 怎么 说 人 是 高 等 动物 呢 ， 自 己 发 明 的 东西 ,一定 要 继承 自己 已 
经 掌握 的 知识 ， 别 跟 上 自己 的 历史 过 不 去 。 伟 大 的 科学 家 们 ， 在 当初 设计 
计算 机 的 时 候 就 想到 我 们 现在 学 习 的 需要 了 ， 一 定 不 能 让 后 世子 孙 再 学 
ee 就 用 小 学 数学 里 面 的 好 了 。 感 谢 那 些 科 学 家 先驱 者 ， 泽 
做 后 世 。 


下 面 计 算 3 个 算术 题 ， 看 看 结果 是 什么 : 








你 可 能 愤怒 了 ， 这 么 简单 的 题目 ， 就 不 要 劳 驾 计算 机 了 ， 太 浪费 








别 着 急 ， 还 是 要 运算 一 下 ， 然 后 看 看 结果 有 没有 不 一 样 ， 要 仔细 观 


6 
>>> 4.0+2 
6.0 
>>> 4.0+2.0 


不 一 样 的 地 方 是 : 第 一 个 公式 结果 是 6， 这 是 一 个 整数 ， 后 面 两 个 
是 6.0， 这 是 浮 点 数 。 

计算 机 做 一 些 四 则 运算 是 不 在 话 下 的 ， 但 是 ， 有 一 个 问题 请 务必 注 
在 数学 中 ， 整 数 是 可 以 无 限 大 的 ， 但 是 在 计算 机 中 ， 整 数 不 能 无 限 
因此 ， 就 会 有 某 种 情况 出 现 ， 就 是 参与 运算 的 数 或 者 运算 结果 超过 
了 计算 机 中 最 大 的 数 了 ， 这 种 问题 称 之 为 “整数 溢出 问题 ”。 
1.1.4 ”整数 洲 出 问题 


在 网 上 能 够 找到 很 多 专门 讨论 “整数 洲 出 ”问题 的 文章 。 





在 东 些 高 级 编程 语言 中 ， 整 数 溢出 是 必须 正视 的 ， 但 是 ， 在 Python 
里 面 就 无 需 忧 愁 了 ， 原 因 就 是 Python 为 我 们 解决 了 这 个 问题 ， 它 文 
持 “ 无 限 精度 ”的 整数 ， 所 以 ， 不 用 考虑 整数 沪 出 的 问题 ，Int 类 型 与 任意 
eons 
-大 Oo 





体验 一 下 大 整数 : 


>>> 123456789870987654321122343445567678890098876*123345566778999009987654333238766 
15227847719352756287004435258757627727756232836203244433901915893701780160167797618 


多 么 幸运 呀 ，Python 做 了 如 此 精妙 的 安排 ， 免 除了 麻烦 ， 所 以 选择 
学 习 Python 就 是 珍惜 光阴 。 


你 还 可 以 在 交互 模式 下 计算 2 的 1000 次 早 ， 计 算 方 法 是 : 
>>> 2 ** 1000 
看 看 结果 是 什么 ? 你 会 感到 惊喜 的 。 


上 面 计算 结果 的 数字 最 后 有 一 个 L， 表 示 这 个 数 是 一 个 长 整数 ， 你 
不 用 管 它 ， 有 反正 是 Python 为 我 们 搞定 了 大 整数 问题 。 


1 








用 单独 一 个 章节 来 说 明 除 法 ， 就 是 因为 它 和 常常 会 带 来 麻烦 ， 不 仪 
Python 会 这 样 ， 很 多 高 级 语言 都 如 此 。 


1.2.1 整数 与 整数 相 除 


进入 Python 交 互 模式 之 后 ， 练 习 下 面 的 运算 : 


>>> 2.0 / 5.0 
0.4 


看 到 了 吗 ? 麻烦 出 来 了 (这 是 在 Python 2.x 中 ) ， 按 照 数学 运算 ， 
以 上 四 个 运算 结果 都 应 该 是 0.4。 但 我 们 看 到 第 一 个 结果 居然 是 0。 
Why? 


在 Python 〈 严 格 说 是 Python 2.x 中 ，Python3 会 有 所 变化 ) 里 面 有 一 
个 规定 ， 像 2/5 这 样 的 除法 要 取 整 (就 是 去 挥 小 数 ， 但 不 是 四 舍 五 
入 ) 。2 除 以 5， 商 是 0〈 整 数 ) ， 余 数 是 2( 整 数 ) 。 如 果 用 这 种 形式 : 
2/5， 那 么 计算 结果 就 是 商 那 个 整数 。 或 者 可 以 理解 为 : 整数 除 以 整 
数 ， 结 果 是 整数 ( 疝 ) 。 


比如 : 





>>> 5 / 2 
2 
>>> 7 / 2 
3 
>>> 8 / 2 
4 


再 次 提醒 : 得 到 是 商 〈 整 数 ) ， 而 不 是 得 到 含有 小 数位 的 结果 再 通 
过 “四 舍 五 入 ”得 到 整数 。 例 如 : 5/2， 得 到 的 商 是 2， 余 数 是 1， 最 终 
5/2=2， 并 不 是 对 结果 进行 四 舍 五 入 得 到 3。 





1.2.2 浮 点 数 与 整数 相 除 


“ 浮 点 数 与 整数 相 除 "用 一 种 貌似 严格 的 语言 表述 : 


假设 .x 除 以 y。 其 中 x 可 能 是 整数 ， 也 可 能 是 浮 点 数 ，y 可 能 是 整 
数 ， 也 可 能 是 浮 操 数 ， 但 两 者 之 中 至 少 有 一 个 是 浮 点 数 。 


出 结论 之 前 ， 还 是 先 在 交互 模式 中 做 实验 : 
>>> 9.0 / 2 


4.5 
>>> 9.0 / 2.0 


>>> 8.0 / 2.0 
4.0 





就 如 同 做 物理 、 化 学 实验 一 样 ， 仔 细 观 察 上 面 的 实验 结果 ， 能 得 出 
什么 结论 ? 


不 管 是 被 除数 还 是 除数 ， 只 要 有 一 个 数 是 浮 点 数 ， 结 果 就 是 浮 点 
数 。 
然而 ， 下 面 的 实验 可 能 又 让 你 有 点 糊涂 了 : 


>>> 10.0 / 3 
3.3333333333333335 








这 个 是 不 是 束 有 扩 搞 怪 了 ? 按照 数学 知识 ， 应 该 是 3.33333...， 后 面 
征 3 的 循环 了 ， 那 么 你 的 计算 机 就 停 不 下 来 了 ， 满 屏 都 是 3。 为 了 避免 这 
个 ，Python 武 断 终 结 了 循环 ， 但 是 ， 可 塌 的 是 没有 按照 “四舍五入 ”的 原 
则 终止 。 当 然 ， 还 会 有 更 奇 琵 的 出 现 : 





>>> 0.1 + 0.2 
0.30000000000000004 

>>> 0.1 + 0.1 - 0.2 

0.0 

>>> 0.1 + 0. 0.1 - 0.3 
5.551115123125783e-17 
>>> 0.1 + 0.1 + 0.1 - 0.2 
0.10000000000000003 


越 来 越 糊 涂 了 ， 为 什么 Computer 姓 女 在 计算 这 么 简单 的 问题 上 ， 如 
此 糊涂 了 呢 ? 


不 是 Computer 寻 女 糊 深 ， 她 依然 冰雪 聪明 。 


原因 在 于 十 进 制 和 二 进 制 的 转换 上 ，Computer 姑 娘 用 的 是 二 进 制 进 
行 计算 ， 上面 的 例子 中 ， 我 们 输入 的 是 十 进 制 ， 就 要 把 十 进 制 的 数 转 化 
为 二 进 制 ， 然 后 再 计算 。 但 是 ， 在 转化 中 ， 浮 点 数 转化 为 二 进 制 ， 惑 出 


问题 了 。 


例如 十 进 制 的 0.1， 转 化 为 二 进 制 是 : 
0.0001100110011001100110011001100110011001100110011... 


也 就 是 说 ， 转 化 为 二 进 制 后， 不 会 精确 等 于 十 进 制 的 0.1。 同 时 ， 
计算 机 存储 的 位 数 是 有 限制 的 ， 所 以 ， 就 出 现 了 上 述 现象 。 


这 种 问题 不 仅仅 在 Python 中 有 ， 上 所 有 文 持 浮 点 数 运算 的 编程 语言 都 
会 遇 到 。 

















明白 了 问题 原因 ， 怎 么 解决 呢 ? 就 Python 的 浮 点 数 运 算 而 言 ， 大 多 
数 计算 机 每 次 计算 误差 不 超过 2 的 53 次 方 分 之 一 。 对 于 大 多 数 任务 这 已 
经 足够 了 ， 但 是 要 在 心中 记 住 这 不 是 十 进 制 算 法 ， 每 个 浮 点 数 计算 可 能 
会 带 来 一 个 新 的 舍 入 错误 。 


一 般 情况 下 ， 只 要 简单 地 将 最 终 显 示 的 结果 用 “四 舍 五 入 ”到 所 期 望 
的 十 进 制 位 数 ， 束 会 得 到 期 望 的 最 终结 果 。 


对 于 需要 非常 精确 的 情况 ， 可 以 使 用 decimal 模 块 〈( 关 于 “模块 "， 后 
面 会 介绍 ， 这 里 暂 存 ) ， 它 实现 的 十 进 制 运 算 适 合 高 精度 要 求 的 应 用 。 
另外 fractions 模 块 文 持 另外 一 种 形式 的 运算 ， 它 实现 的 运算 基于 有 理 数 
《因此 像 V3 这 样 的 数字 可 以 精确 地 表示 ) 。 最 高 要 求 则 是 使 用 由 SciPy 
提供 的 Numerical Python 包 和 其 他 用 于 数学 和 统计 学 的 包 。 列 出 这 些 东 

















西 ， 仅 仅 是 让 读者 明白 ， 问 题 己 经 解决 ， 并 且 方 式 很 多 。 


1.2.3 ”引用 模块 解决 除法 问题 








Python 之 所 以 受 人 欢迎 ， 一 个 很 重重 要 的 原因 就 是 “轮子 ”多 ， 当 然 
这 是 比喻 ， 就 好 比 你 要 跑 得 快 ， 怎 么 办 ? 光 天 天 练习 跑步 也 是 不 行 的 ， 
还 要 用 轮子 。 找 辆 目 行车 ， 束 快 了 很 多 ， 大 还 嫌 不 够 快 ， 再 换 电 瓶 车 、 
汽车 、 高 铁 .…… 反 正 可 以 供 你 选择 的 很 多 。 但 是 ， 这 些 让 你 跑 得 快 的 东 
西 ， 多 数 不 是 你 自己 造 的 ， 是 别人 造 好 了 你 来 用 。 甚 至 两 条 腿 也 是 感谢 
父母 恩赐 。 正 是 因为 轮子 多 ， 可 以 选择 的 多 ， 束 可 以 有 各 种 不 同 的 速度 








轮子 是 人 类 伟大 的 发 明 。 
Python 就 是 这 样 ， 有 各 种 “轮子 " 供 我 们 选用 。 只 不 过 那些 "轮子 "在 
Python 里 面 的 名 字 不 叫 自行 车 、 汽 车 ， 而 叫 "模块 *， 有 的 还 叫 
作 " 库 "、“ 类 ”， 
怎么 用 ? 可 以 通过 以 下 两 种 形式 。 


形式 1: import module-name。import 后 面 跟 空 格 ， 然 后 是 模块 名 
称 ， 例 如 : import os。 





形式 2: from modulel import module11。modulel 是 一 个 大 模块 ， 里 
面 还 有 子 模 块 module11， 只 想 用 module11， 就 这 么 写 。 


找 一 个 解决 除法 问题 的 轮子 : 


>>> from __future _ import division 
>>> 5 / 2 


引用 了 模块 之 后 再 做 除法 ， 那 么 不 管 什么 情况 ， 痢 能 得 到 浮 点 数 的 


结果 了 。 
这 束 是 “轮子 ”的 力量 。 


1.2.4 余数 
前 面 计算 5/2 的 时 候 ， 商 是 2， 余 数 是 1 


余数 怎么 得 到 ? 在 python 中 (其实 大 多 数 语 言 也 如 此 ) ， 用 % 符 号 
来 取得 两 个 数 相 除 的 余数 。 





> Le 
实验 下 面 的 操作 : 

>>> 5 % 2 

1 

>>> 6 % 4 

2 

>>> 5.0 % 2 

1.0 





利用 符号 “%” 可 以 得 到 两 个 数 〈( 可 以 是 整数 ， 也 可 以 是 浮 点 数 ) 相 
除 的 余数 。 


除了 利用 ”“%?” 符 号 之 外 ， 还 可 以 使 用 内 建 函 数 ， 完 成 同样 的 工作 。 
>>> divmod(5,2) # 表 示 
5 除 以 


2， 返 回 了 商 和 余数 





(2, 1) 

>>> divmod(9,2) 
(4, 1 

>>> divmod(5.0,2) 
(2.0, 1.0) 





内 建 函 数 divmodO 返 回 的 是 两 个 值 ， 这 两 个 值 在 一 个 圆 括号 内 ， 圆 
括 写 内 的 数字 第 一 个 表示 两 ， 第 二 个 表示 余数 。 


1 5 四 


“四 合 五 入 * 在 运算 中 是 经 党 遇 到 的 ， 按 照 我 们 已 经 对 Python 的 理 
解 ， 其 应 该 提供 一 个 简单 的 方法 。 En 


>>> round(1.234567, 2) 
1.23 
>>> round(1.234567, 3) 
1.235 


>>> round(10.0/3, 4) 
3.3333 


在 round0 中 的 第 二 个 数 ， 表 示 要 保留 的 小 数位 数 ， 返 回 值 是 一 个 四 
合 五 入 之 后 的 数值 。 


简单 吧 ? 越 简单 的 时 候 ， 越 要 小 心 ， 当 你 遇 到 下 面 的 情况 ， 就 会 有 
扩 儿 怀疑 


>>> round(1.2345,3) 
1.234 # 应 该 是 : 


1i235 
>>> round(2.235,2) 
2.23 # 应 该 是 : 


2 .24 
哈哈 ， 我 发 现 了 Python 的 一 个 Bug， 太 激动 了 。 


如 果真 的 是 Bug， 还 这 么 明显 ， 是 轮 不 到 我 的 。 为 什 
具体 解释 看 这 里 ， 下 面 摘录 官方 文档 中 的 一 段 话 : 





Note:The behavior of round()for floats can be surprising:for example, 
round (2.675, 2) gives 2.67 instead of the expected 2.68.This is not a 
bug:it’s a result of the fact that most decimal fractions can’t be represented 
exactly as a float.See Floating Point Arithmetic:Issues and Limitations for 
more information. 


0 归根 到 底 还 是 译 点 数 中 的 十 进 制 转化 为 二 进 制 
邦 的 袖 


除法 的 问题 似乎 要 到 此 结束 了 ， 其 实 远 远 没有 ， 不 过 ， 作 为 初学 
者 ， 至 此 即 可 。 


1.3 ”常用 数学 函数 和 运算 优先 级 


在 数学 之 中 ， 除 了 加 减 乘除 四 则 运算 之 外 (这 是 小 学 数学 ) ， 还 有 
其 他 更 多 的 运算 ， 比 如 乘 方 、 开 方 、 对 数 运 算 等 ， 要 实现 这 些 运算 ， 需 
要 用 到 Python 中 的 一 个 模块 : math。 











1.3.1 使 用 math 模 块 


math 模 块 是 Python 标准 库 中 的 ， 所 以 不 用 安装 就 可 以 直接 使 用 。 使 
用 方法 是 : 


>>> import math 





用 import 融 将 math 模 块 引用 过 来 了 了， 下 面 就 可 以 使 用 这 个 模 英 提供 
的 工具 了 。 比 如 ， 要 得 到 圆周 率 : 


>>> math .pi 
3.141592653589793 


这 个 模块 都 能 做 哪些 事情 呢 ? 可 以 用 下 面 的 方法 看 到 : 


>>> dir(math) 
['_doc ', '_name ', '_ package ', 'acos', 'acosh', 'asin', 'asinh', 'atan' 





dir (module) 是 一 个 非常 有 用 的 指令 ， 可 以 通过 它 查 看 任何 模块 中 
所 包含 的 工具 。 从 上 面 的 列表 中 惑 可 以 看 出 ， 在 math 模 块 中 ， 可 以 计算 
正弦 sin()、 余 弦 cos()、 开 平方 0sqrt0) 等 函数 。 


这 些 函 数 是 math 中 提供 的 ， 不 需要 我 们 编写 ， 可 以 拿 过 来 就 用 。 比 
如 计算 乘 方 ， 可 以 使 用 pow 函 数 。 但 是 ， 怎 么 用 呢 ? 

Python 是 一 个 非常 周到 的 “ 姑 妇 ”， 她 早 就 提供 了 一 个 命令 ， 让 我 们 
来 查看 每 个 函数 的 使 用 方法 。 





>>> help(math.pow) 


在 交互 模式 下 输入 上 面 的 指令 ， 然 后 回 车 ， 看 到 下 面 的 信息 : 


Help on built-in function pow in module math : 
pow(...) 

pow(x, y) 

Return x**y (x to the power of y). 


这 里 非常 清楚 地 告诉 了 我 们 math 中 的 pow 函 数 的 使 用 方法 和 相关 说 
明 。 


由 于 是 第 一 次 用 到 helpO0， 有 必要 将 结果 详细 解释 一 番 。 


1) 第 一 行 意思 是 说 这 里 是 math 模 块 的 内 建 函 数 pow 的 帮助 信息 
Cbuilt-in 称 之 为 内 建 函 数 ， 是 说 这 个 函数 是 Python 默认 的 ) 。 


2) 第 三 行 表 示 这 个 函数 的 参数 ， 有 两 个 ， 也 是 函数 的 调用 方式 。 


和 第 四 行 是 对 函数 的 说 明 ， 返 回 x**y 的 结果 ， 并 且 在 后 面 解释 了 
Xi 六 六 《 含义 。 


最 后 ， 按 q 键 返回 到 Python 交互 模式 。 


当然 ， 也 看 到 了 一 个 额外 的 信息 ， 就 是 pow 函 数 和 x**y 是 等 效 的， 
都 是 计算 x 的 y 次 方 。 





>>> math. pow(4,2) 
16.0 


>>> 4 *2 
8 


特别 注意 ，4**2 和 4*2 是 有 很 大 区 别 的 。 
用 help0 函 数 ， 可 以 查看 math 模 块 中 任何 一 个 函数 的 使 用 方法 。 


下 面 是 几 个 第 用 的 math 模 块 中 函数 举例 ， 你 可 以 结合 目 己 调试 的 进 
行 比照 。 


>>> math.sqrt(9) 


>>> math.floor(3.14) 


>>> math.floor(3.92) 
3.0 
>>> math.fabs(-2) # 等 价 于 





abs(-2) 

2.0 

>>> abs(-2) 
2 

>>> math.fmod(5,3) ”# 等 价 于 





5%3 

2.0 

>>> 5%3 
2 


在 上 面 的 内 容 中 ， 读 者 除了 要 了 解 math 模 块 外 ， 还 要 体会 对 后 续 学 
习 非 常 有 帮助 的 内 建 函 数 dir() 和 help()。 


1.3.2 ”两 个 函数 
下 面 两 个 也 是 常用 的 数学 函数 。 


1. 求 绝对 值 


>>> abs(10) 
10 

>>> abs(-10) 
10 


>>> abs(-1.2) 
1 和 2 


2 四 管 五 人 


>>> round(1.234) 
1.0 
>>> round(1.234, 2) 


如 果 不 清 楚 这 个 函数 的 用 法 ， 可 以 使 用 下 面 的 方法 看 帮助 信息 。 


>>> help(round) 

Help on built-in function round in module builtin_ _ 

round(...) 
round(number[, ndigits]) -> floating point number 
Round a number to a given precision in decimal digits (default © digits). 
This always returns a floating point number. Precision may be negative. 


1.33 运算 估 儿 县 


从 小 学 数学 开始 ， 就 研究 运算 优先 级 的 问题 ， 比 如 在 四 则 运算 
中 “ 先 乘 除 ， 后 加 减 ”， 说 明 乘 法 和 除法 的 优先 级 要 高 于 加 法 和 减法 。 对 
于 同一 级 别 的 ， 就 按照 “从 左 到 右 ” 的 顺序 进行 计算 。 

下 面 的 表格 中 列 出 了 Python 中 的 各 种 运算 的 优先 级 顺序 。 不 过 ， 就 
一 般 情况 而 言 ， 不 需要 记忆 ， 完 全 可 以 按照 数学 中 的 运算 规则 去 理解 ， 
因为 人 类 既然 已 经 发 明了 数学 ， 在 计算 机 中 进行 的 运算 就 不 需要 重新 编 
写 一 套 新 规范 了， 只 需要 符合 数学 中 的 运算 规则 即 可 。 

在 此 读者 只 需要 看 个 大 构 、 有 个 印象 即 可 ， 可 以 一 边 回 后 阅读 ， 一 
边 回 来 翻阅 ， 或 者 在 用 到 的 时 候 来 这 里 查看 。 如 表 1-1 所 示 。 


表 1-1 运算 规则 


























lambda Lambda 表达 式 
or 布尔 “或 ” 


and 布尔 “与 ” 











DotX 布尔 “ 非 ” 





in, notin 成 员 测 试 

is, is not 同一 性 测试 

比较 

按 位 或 

按 位 异 或 

按 位 与 

移 位 

加 法 与 减法 

乘法 、 除 法 与 取 余 
正 负 号 


按 位 翻转 









































最 后 要 提 及 的 是 运算 中 的 绝 杀 : 括号 。 只 要 有 括号 ， 就 先 计 算 括号 





里 面 的。 这 是 数学 中 的 共识 ， 无 项 解释 。 








1.4 第 一 个 简单 的 程序 


通过 对 四 则 运算 的 学 习 ， 已 经 初步 接触 了 Python 中 的 内 容 ， 如 果 是 
零 基础 的 学 习 者 ， 可 能 会 有 点 迷惑 ， 难 道 敲 几 个 命令 ， 然 后 看 到 结果 ， 
就 算 编 程 了 ? 这 也 不 是 那些 能 够 自动 运行 的 程序 啊 ? 

到 目前 为 止 ， 还 不 能 算 编 程 ， 只 能 算 会 用 一 些 指令 (或 者 叫 作 合 
令 ) 来 做 点 儿 简单 的 工作 。 


少 安 毋 躁 ， 下 面 就 开始 编写 一 个 真正 的 、 简 单 的 程序 。 





1.4.1 程序 





下 面 一 段 内 容 是 关于 程序 的 概念 ， 和 内容 来 目 维基 百科 : 


计算 机 程序 Computer Program) 是 指 一 组 指示 计算 机 或 其 他 具有 
信息 处 理 能 力 、 装 置 每 一 步 动 作 的 指令 ， 通 常用 某 种 程序 设计 语言 因 
写 ， 运 行 于 某 种 目标 体系 结构 上 。 打 个 比方 ， 一 个 程序 就 像 一 个 用 汉语 
(程序 设计 语言 〉 写 下 的 红烧 肉 菜 谱 〈 程 序 ) ， 用 于 指导 懂 汉 语 矢 饪 
手法 的 人 《体系 结构 ) 来 做 这 个 荣 。 


通常 ， 计 算 机 程序 要 经 过 编译 和 链接 而 成 为 一 种 人 们 不 易 看 清 而 计 
算 机 可 解读 的 格式 ， 然 后 运行 。 未 经 编译 束 可 运行 的 程序 ， 通 常 称 之 为 
脚本 程序 〈script) 。 


简 而 言 之 ， 程 序 就 是 指令 的 集合 。 但 是 ， 有 的 程序 需要 编译 ， 有 的 
不 需要 。Python 编 写 的 程序 就 不 需要 编译 ， 因 此 她 也 被 称 之 为 解释 性 语 
言 ， 编 程 出 来 的 程序 叫 作 脚本 程序 。 


东 些 程序 员 认 为 “编译 型 语言 比 解 释 性 语言 高 价 ”， 这 有 是 错误 的 。 不 
要 认为 编译 的 程序 好 ， 不 编译 的 整 不 好， 也 不 要 认为 编译 的 程序 属 
于 “高 端 ”， 不 编译 的 就 属于 “ 低 端 ”， 这 是 坚 无 根据 的 。 









































不 和 争论， 用 得 妙 就 是 好 。 


1.4.2 ”用 IDE 编 程 





在 实践 中 ， 每 个 人 都 有 自己 喜欢 的 IDE。 所 以 ， 也 请 读者 在 学 习 中 
找到 自己 喜欢 的 IDE， 


Python 有 一 个 默认 IDE， 当 打开 了 Python Shell 之 后 ， 通 过 “File- 
>New window” 打 开 一 个 文本 编辑 界面 。 如 图 1-2 所 示 。 在 这 个 界面 中 整 
可 以 写 程序 了 。 


在 这 个 界面 看 不 到 用 于 输入 指令 的 提示 符 “>>>”， 这 个 界面 有 斥 像 
记事 本 。 说 对 了 ， 其 本 质 上 就 是 一 个 记事 本 ， 只 能 输入 文本 ， 不 能 直接 
在 里 面 贴图 片 。 如 图 1-3 所 示 。 








7 Python Shell -oe Ea 


Edit Shell Debug Options Windows Help 


New Window Ctrl+N 





r 11 2012, 07:15:24) [MSC v.1500 32 bit (=| 








Open... Ctrl+O s" or "license()" for more information. 
Recent Files 》 
Open Module.，Akt+M 
Class Browser Alt+C 11 last): 
Path Browser 中 1, in <module> 
Save CtrirS 3 not defined 
Save As... Ctrl+Shift+9 
Save Copy As... Alt+Shift+S 
print Window Ctri+P Ln:7ICok0 
Close Alt+F4 
f Ctrl*Q 


图 1-2 文本 编辑 界面 




















File Edit Debug Options Windows Help 


*Untitled* 
| - File Edit Format Run Options Windows Help 
了 这 本 质 上 就是 记事 本 








图 1-3 ”输入 界面 
1.4.3 Hello, World 
“Hello，World” 是 面 问世 界 的 标志 ， 所 以 ， 任 何 程序 的 第 一 句 一 定 


要 写 这 个 ， 因 为 程序 员 是 面 癌 世界 的 ， 绝 对 不 长 缩 在 东 个 局 域 网 内 。 
直接 上 人 代码， 就 这 么 一 行 即 可 。 








print "Hello,Wworld" 


如 图 1-4 所 示 为 代码 样式 。 


程序 就 是 指令 的 集合 。 现 在 ， 这 个 程序 里 面 束 一 条 指令 ， 一 条 指令 
也 可 以 成 为 集合 。 


注意 观察 ， 单 击 Run 菜 单 ， 在 下 拉 列 表 里 面 选择 “Run Module”， 如 
图 1-5 所 示 。 


| 


File Edit Format Run Options Windows Help 





图 1-4 代码 样式 


File Edit Format Run | Options Windows Help 








Python Shel 





Check Module Alt+X 
Run Module FS 





图 1-5 ” 单 击 菜单 选项 





然后 弹出 对 话 框 ， 要 求 把 这 个 文件 保存 ， 将 文件 保存 到 一 个 位 置 ， 
一 定 要 记 住 这 个 位 置 ， 并 且 取 个 文件 名 ， 文 件 名 以 .py 为 扩展 名 。 


都 做 好 之 后 ， 单 击 “ 人 确定 ”按钮 ， 束 会 发 现在 男 外 一 个 带 有 “>>>” 的 
界面 中 ， 就 自动 出 来 了 “Hello，World” 两 个 大 字 。 

成 功 了 吗 ? 成 功 了 也 别 兴 奋 ， 因 为 还 没有 到 庆祝 的 时 候 。 

在 这 种 情况 下 ， 我 们 依然 是 在 IDE 的 环境 中 实现 了 刚才 那 段 程序 的 
自动 执行 ， 如 果 脱 离 这 个 环境 呢 ? 

关闭 IDLE， 打 开 shell， 或 者 打开 cmd， 通 过 命令 的 方式 ， 进 入 到 你 
刚才 保存 的 文件 目录 。 





qw@qw-Latitude-E43060:~/Documents/ITArticles/Basicpython/codes$ ls 


165.py 
qw@qw-Latitude-E4360:~/Documents/ITArticles/Basicpython/codes$ 





这 个 文件 夹 里 面 束 一 个 文件 ， 名 为 105.py， 束 是 刚才 保存 的 那个 文 
然后 在 这 个 shell 里 面 输 入 : python 105.py。 


十 面 这 铝 语 的 合 义 束 古 : 告诉 计算 机 运行 一 个 Python 语言 编写 的 程 
序 ， 程 序 文件 的 名 称 是 105.py 


我 的 计算 机 我 做 主 ， 于 是 它 秘 季 地 执行 了 这 条 命令 。 如 下 图 : 


qw@qw-Latitude-E439690:~/Documents/ITArticles/Basicpython/codes$ ls 
105 .py 


qwGqw-Latitude-E4300:~/Documents/ITArticLes/BasicPython/codes5$ python 165.py 


HeLtLo ,WorLd 
qwGqw-Latitude-E4300:~/Documents/ITArticLes/BasicPython/codes5 





还 在 沉默 ? 可 以 欢呼 了 。 因 为 你 在 程序 员 道路 上 迈 出 了 伟大 的 第 二 
(思考 ; 什么 时 候 迈 出 的 第 一 步 ? ) 。 





1.4.4 解 一 道 题目 


题目 ; 请 计算 19+2*48/2 
读者 先 自己 仰望 天 空 (或 者 天 花 板 ) 冥想 一 下 大 概 如 何 写 ， 然 后 继 


击 
续 。 


代码 : 


#!/UsSr/bin/env python 
#coding:utf-8 


请 计算 : 19+2*48/2 


a=19+2*4- 


8/2 
print a 


提醒 初学 者 ， 不 要 复制 这 段 代码 ， 要 一 个 字 一 个 字 地 痪 进去 ， 然 后 
保存 我 保存 的 文件 名 是 : 105-1.py) 。 


在 shell 或 者 cmd 中 ， 执 行 : python 文 件 名 .py。 
执行 结果 如 下 图 : 


qw@qw-Latitude-E43060:~/Documents/ITArticles/Basicpython/codes$ python 1605-1.py 
23 





好 像 还 是 比较 简单 。 
下 面 对 这 个 简单 程序 进行 解释 。 
#1!/UsSr/bin/env python 


这 一 行 是 必须 写 的 ， 它 能 够 引导 程序 找到 Python 的 解释 器 《或 者 叫 
解析 器 、 和 直译 上 器) 。 也 就 是 说 ， 不 管 这 个 文件 保存 在 什么 地 方 ， 这 个 程 
序 都 能 执行 ， 而 不 用 指定 Python 的 安装 路 径 。 


解释 器 〈Interpreter) ， 是 一 种 电脑 程序 ， 能 够 把 高 级 编程 语言 逐 
行 直接 翻译 运行 。 解 释 器 不 会 一 次 性 把 整个 程序 翻译 出 来 ， 只 像 一 
位 “中 间 人 ”， 每 次 运行 程序 时 都 要 先 转 成 男 一 种 语言 再 运行 ， 因 此 解释 
器 的 程序 运行 速度 比较 缓慢 。 它 每 翻译 一 行程 序 语句 就 立刻 运行 ， 然 后 
再 翻译 下 一 行 ， 再 运行 ， 如 此 不 停 地 进行 下 去 。 


解释 需 的 好 处 是 它 消 除了 编译 整个 程序 的 负担 ， 但 也 会 让 运行 时 的 
效率 打折 扣 。 相 对 地 ， 编 译 器 并 不 运行 程序 或 源 代 码 ， 而 是 一 次 将 其 翻 
详 成 另 一 种 语言 ， 如 机 需 码 ， 以 供 多 次 运行 而 无 须 再 编译 。 其 制 成 品 无 
须 依 赖 编 详 器 而 运行 ， 程 序 运 行 速度 比较 快 。〈 来 目 《维基 百科 》 ) 
































#coding:utf-8 


这 一 行 是 告诉 Python， 本 程序 采用 的 编码 格式 是 utf-8， 什 么 是 编 
码 ? 什么 是 utf-8? 这 是 一 个 比较 复杂 且 有 历史 的 问题 ， 此 处 暂 不 讨论 。 
只 有 有 了 上 面 这 人 句 话 ， 在 后 面 的 程序 中 才能 写 汉 字 ， 侍 则 束 会 报错 。 





请 计算 : 


19+2*47?8/2 
mn 


这 一 行 是 让 人 看 的 ， 而 计算 机 看 不 懂 。 在 Python 程序 中 《 别 的 编程 
语言 也 是 如 此 ) ， 要 写 所 谓 的 注释 ， 就 是 对 程序 或 者 茶 段 语句 的 说 明文 
字 ， 这 些 文字 在 计算 机 执行 程序 的 时 候 被 计算 机 姑娘 忽略 ， 但 是 ， 必 要 
的 注释 又 是 必 不 可 少 的 ， 正 如 前 面 说 的 那样 ， 程 序 在 大 多 数 情况 下 是 给 
人 看 的 ， 注 释 就 是 帮助 人 理解 程序 的 。 当 然 ， 本 程序 中 的 注释 是 不 必要 
的 ， 纯 粹 是 为 了 说 明 注 释 而 写 。 


写 注释 的 方式 有 两 种 ， 一 种 是 单行 注释 ， 用 “#*? 开 涉 ， 男 一 种 是 多 
行 注释 ， 用 一 对 “"”( 三 个 单 引号 ) 包 于 起 来 。 


用 # 开 头 的 注释 ， 可 以 像 下 面 这 样 来 写 : 


# 请 计算 : 














19+2*48/2 


这 种 注释 通常 写 在 程序 中 的 茶 个 位 置 ， 比 如 茶 个 语句 的 前 面 或 者 后 
面 。 计 算 机 也 会 忽略 这 种 注释 的 内 容 ， 因 为 只 是 给 人 看 的 。 


一 般 在 程序 的 开头 部 分 都 要 写 氮 东西 ， 主 要 是 告诉 别人 这 个 程序 是 
人 
工 No 

















所 谓语 句 ， 就 是 告诉 程序 要 做 什么 事情 。 程 序 是 由 各 种 各 样 的 语句 
组 成 的 。 这 条 语句 还 有 一 个 名 字 ， 叫 作 赋 值 语句 。19+2*48/2 是 一 个 表 


达 式 ， 最 后 要 计算 出 一 个 结果 ， 这 个 结果 就 是 一 个 对 象 。 


“=*， 不 要 理解 为 数学 中 的 等 号 ， 它 的 作用 不 是 “等 于 *， 而 是 完成 
赋值 语句 中 “赋值 ”的 功能 。a 是 变量 。 这 样 就 完成 了 一 个 赋 什 过程。 


语句 和 表达 陈 的 区 别 : “表达 式 就 是 东 件 事 ”, “语句 是 做 茶 件 事 ”。 














print a 


这 还 是 一 个 语句 ， 称 之 为 print 语 句 ， 就 是 要 打印 出 a 的 值 《这 种 说 
法 不 是 非常 严格 ， 但 是 通常 都 这 么 说 。 严 格 的 说 法 是 打印 变量 a 做 对 应 
的 对 象 的 值 。 但 这 种 说 法 哆 明 ， 束 直 接 说 打印 a 的 值 〉。 


古 不 是 在 为 看 到 上 自己 写 的 第 一 个 程序 而 欣慰 呢 ? 




















如 果 要 对 目 然 语言 分 类 ， 则 第 见 的 是 英语 、 法 语 、 汉 语 等 ， 语 言 学 
专家 还 会 把 他 们 归 类 为 什么 语系 。 我 虽然 不 是 语言 学 专家 ， 但 是 也 做 了 
一 点 目 己 的 思考 ， 虽 然 尚 未 得 到 广大 人 民 群 众 和 研究 者 的 广泛 认同 ， 但 
0 

己 壮 壮 胆 。 


我 对 语言 的 分 类 方法 是 : 


类 别 一 :语言 中 的 两 个 元 素 〈 比 如 两 个 字 〉 拼 接 在 一 起 ， 出 来 一 个 
新 的 元 素 〈《 比 如 把 “ 女 ”? 和 * 子 ?拼接 起 来 ， 就 是 “好 >?， 得 到 了 新 的 

了 

类 别 二 : 两 个 元 系 连 接 在 一 起 (与 “拼接 ”有 差别 ) ， 也 就 是 这 两 个 
元 素 并 列 显 示 。 比 如 “好 ”和 “人 ”， 两 个 元 素 连 接 在 一 起 是 “好 人 ”。 

而 3 和 5 拼接 (就 是 整数 求 和 ) 在 一 起 是 8 属于 第 一 类 ) ， 如 果 连 
接 ， 就 是 35， 那 就 属于 第 二 类 了 。 


上 述 分 类 方法 也 适用 于 更 文 ， 是 人 否 适 用 于 其 他 语种 还 有 待 验证 。 
把 我 的 这 种 分 法 抽象 一 下 (因为 有 这 种 简单 的 抽象 ， 才 显示 出 上 述 
语言 的 分 类 方法 高 于 一 般 的 语言 学 专家 所 认同 的 方法 ) : 
。 类 别 一 是 : 人 A+D=o 
e。 类 别 二 是 : A+DO= 人 和 人口 


根据 我 个 人 的 研究 ， 在 目前 知晓 的 语言 范畴 中 ， 都 没有 离开 以 上 两 


种 分 类 ， 不 是 第 一 类 就 是 第 二 类 。 




















1.5.1 字符 串 


在 我 洋洋 目 得 的 时 候 ， 我 搜索 了 一 下 ， 才 及 现 目 己 没 那么 高 明 ， 维 


基 百 科 的 “字符 串 ” 词 条 是 这 么 说 的 : 


字符 串 (String) ， 是 由 零 个 或 多 个 字符 组 成 的 有 限 串 行 。 一 般 记 
为 s=a[1]a[2]...a[n]。 


看 到 维基 百科 的 伟大 了 吧 ， 它 已 经 把 我 所 设想 的 那 种 情况 取 了 一 个 
形象 的 名 称 ， 叫 作 人 字符 串 ， 其 本 质 上 残 是 一 早 字符 。 


根据 这 个 定义 ， 前 面 两 次 让 一 个 程序 员 感 到 伟大 的 “Hello， 
World” 束 是 一 个 字符 串 。 或 者 说 不 管 是 用 瑞 文 还 是 中 文 还 是 别 的 某 种 
文 ， 写 出 来 的 文字 都 可 以 作为 字符 串 对 等， 当然 ， 里 面 的 特殊 人 符号， 也 
可 以 作为 字符 串 ， 比 如 空格 等 。 


在 Python 中 ,“ 万 物 名 对 象 ”， 显 然 “Hello，World” 束 是 一 个 对 象 ， 
这 个 对 象 是 一 个 字符 串 ， 也 束 是 说 ， 字 符 串 是 对 象 类 型 ， 用 str 表 示 ， 这 
就 如 同 前 面 过 到 的 int 类 型 一 样 。 字 符 串 类 型 的 对 象 通常 用 单 引 号 或 者 双 
引号 包 早 起 来 。 








>>> "I love Python." 
'I love Python.' 
>>> 'I LOVE PYTHON.' 
'I LOVE PYTHON.' 





ey 以 看 出 ， 不 论 是 使 用 单 引 号 还 是 双 引 号 ， 结 果 都 


日 
XE 


>>> 250 

250 

>>> type(250) 
<type "Int "> 
wy "250" 

"250 

>>> type("250") 
<type 'str'> 


在 这 个 例子 中 同样 是 250， 但 区 别 很 大 。 一 个 没有 放 在 引号 里 面 ， 
一 个 放 在 了 引号 里 面 ， 用 type0 函 数 来 检验 一 下 ， 发 现 它们 居然 是 两 种 
不 同 的 对 象 类 型 ， 前 者 是 int 类 型 ， 后 者 则 是 str 类 型 ， 即 字符 串 类 型 。 所 
以 ， 请 大 家 务必 注意 ， 不 是 所 有 数字 都 是 int (或 者 float〉 类 型 ， 如 果 它 
在 引号 里 面 ， 就 是 字符 串 了 。 如 果 搞 不 清楚 是 什么 类 型 的 话 ， 束 让 
type0 来 帮忙 搞定 。 














操练 起 来 : 


>>> print "good good study, day day up" 
good good study, day day up 
>>> print "----good---study---day----up" 
----go0d---study---day----up 





在 print 后 面 打印 的 都 是 字符 串 。 注 意 ， 引 号 不 是 字符 串 的 组 成 部 
分 ， 而 是 在 告诉 计算 机 里 面包 右 着 的 是 一 个 字符 串 。 如 果 使 用 Python 
应 该 使 用 print0 函 数 ， 在 Python 3.x 中 ， 类 似 的 效果 由 PrintO 函 数 完 


爱 思考 的 读者 肯定 想到 一 个 问题 ， 如 琳 要 把 下 面 这 人 句 话 看 作 一 个 字 
符 串 应 该 怎么 做 ? 


What 's your name? 


这 人 句 话 中 有 一 个 单 引 号 ， 如 采 在 交互 模式 中 像 上 面 那样 直接 输入 ， 
就 会 这 样 : 
>>> 'What's your name? 


File "<stdin>", line 1 
'What's your name? 
Ea 


SyntaxError: invalid syntax 


出 现 了 SyntaxEror( 语 法 错误 ) 引导 的 提示 ， 这 是 在 告诉 我 们 这 里 
存在 错误 ， 错 误 的 类 型 就 是 SyntaxError， 后 面 是 对 这 种 错误 的 解 
释 “invalid syntax”( 无 效 的 语法 ) 。 特 别 注 意 ， 错 误 提 示 的 上 面 ， 有 一 
个 ”符号 ， 指 着 一 个 单 引 写 ， 是 在 告诉 我 们 这 里 出 现 错误 了 。 


在 Python 中 ， 这 一 点 是 非常 友好 的 ， 如 果 语 句 存 在 错误 ， 束 会 将 错 
误 输 出 来 ， 供 程序 员 参 考 。 当 然 ， 有 时 候 错误 来 源 比 较 复 杂 ， 需 要 根据 
经 验 和 知识 进行 修改 。 还 有 一 种 修改 错误 的 好 办 法 ， 束 是 将 错误 提示 放 
到 Google 中 进行 搜索 。 


上 面 那 个 值 的 错误 原因 是 什么 呢 ? 仔细 观察 ， 发 现在 那 句 话 中 事实 
上 有 三 个 单 引 号 ， 本 来 一 对 单 引 号 之 间 包 囊 的 是 一 个 字符 串 ， 现 在 出 现 
了 三 个 单 引 号 ，Compnuter 姑 娘 迷 落 了 ， 她 不 知道 单 引号 包 庄 的 到 底 是 
谁 ， 于 是 报错 。 

















解决 方法 一 : 双 引 号 包 库 单 引 号 


>>> "What 's your name?" 
"What 's your name?" 





双 引 号 里 面 允 许 出 现 单 引号 ， 反 过 来 ， 单 引号 里 面 也 可 以 包 右 双 引 
号 ， 这 个 可 以 笼统 地 称 为 二 者 的 蔡 套 。 


解决 方法 二 : 使 用 转 义 符 
所 谓 转 义 ， 就 是 让 东 个 符号 不 再 表示 茶 种 含义 ， 而 是 表示 另外 一 种 
含义 。 转 义 符 的 作用 就 是 它 能 够 转变 符号 的 含义 。 在 Python 中 ，， 


用 “ww ( 反 斜 杠 》 作 为 转 义 符 《 其 他 很 多 语言 只 要 有 转 义 符 的 ， 都 用 这 个 
符号 ) 。 








>>> 'What\'s your name?' 
"What's your name?" 


是 不 是 看 到 转 义 符 的 作用 了 ? 
本 来 单 引号 不 是 字符 串 的 一 部 分 ， 但 是 如 果 前 面 有 转 义 符 ， 那 么 它 
就 失去 了 原来 的 含义 ， 转 化 为 字符 惠 的 一 部 分 ， 相 当 于 一 个 特殊 字 和 


天 于 转 义 符 的 问题 后 面 还 会 遇 到 ， 性 子 急 的 读者 可 以 问 后 翻阅 或 者 
目 己 搜索 一 下 。 


1.5.2 ”变量 和 字符 串 











大 家 对 于 “变量 ”已 经 不 陌生 了 吧 ， 这 里 是 第 二 次 出 现 了 , “一 回 生 
二 回 熟 "。 一 条 金 科 玉 律 是 ， 在 Python 中 “变量 无 类 型 ， 对 象 有 类 型 ”。 变 
量 相当 于 一 个 标签 ， 贴 在 了 不 同 的 对 象 上 。 这 种 “ 贴 ?的 动作 ， 可 以 通过 
复制 语句 完成 。 


同样 ， 对 字符 串 类 型 的 对 象 也 是 这 样 ， 能 够 通过 赋值 语句 ， 将 对 象 
与 某 个 标签 (变量 ) 关联 起 来 。 








>>> b = "hello,world" 
>>> b 

'hello,world' 

>>> print b 
hello,world 


(一 


依然 请 出 typeO 函 数 ， 得 到 变量 类 型 : 


>>> type(b) 
<type 'str'> 


153 迁 你 他 和 傈 昌 


把 两 个 数字 用 “+” 符 号 连接 起 来 ， 比 如 3+5， 结 采 为 8， 这 其 实 是 求 
和 和。 但是， 对 字符 串 进 行 类 似 操 作 呢 ? 是 这 样 的 : 


>>> "py" 十 "thon" 
'python' 


两 个 字符 串 “ 相 加 ”， 就 相当 于 把 两 个 字符 串 连 接 起 来 。 别 的 运算 就 
别 笃 试 了 ， 没 什么 意义 ， 肯 定 报错 ， 不 信 就 试 试 : 

















>>>"py"-"thon" # 我 这 么 做 ， 是 不 是 脑袋 进 水 泥 了 ? 


Traceback (most recent call last): 
File "<stdin>", line 1, in <module> 
TypeError: unsupported operand type(s) for -: 'str' and 'str' 


用 “+4” 号 实现 连接 的 确 比较 简单 ， 不 过 ， 有 了 时候 你 会 遇 到 这 样 的 问 


>>> a = 1989 
>>> b = "free" 
>>> print b + a 
Traceback (most recent call last): 
File "<stdin>", line 1, in <module> 
TypeError: cannot concatenate 'str' and 'int' objects 


报错 了 ， 其 错误 原因 已 经 打印 出 来 了 (一定 要 注意 看 打印 出 来 的 信 
轧 ， 这 是 解决 问题 的 入 口 ) : cannot concatenate'strand'int'objects。 原 来 a 





对 应 的 对 象 是 一 个 int 类 型 的 ， 不 能 将 它 和 str 类 型 的 对 象 连接 起 来 。 怎 么 
办 ? 


用 “+” 拼 接 起 来 的 两 个 对 象 必须 是 同一 种 类 型 的 。 如 果 两 个 部 是 数 
i 就 是 求 和 ;， 如 果 都 是 字符 串 ， 那 么 束 得 到 一 个 
新 的 字符 


修改 上 面 的 错误 ， 可 以 通过 以 下 方法 : 





>>> print b + ‘a. 
free1989 





你 是 不 是 照 着 上 面 融 过 代码 呢 ? 你 的 结果 有 没有 报错 ? 


注意 : “是 反 引 号 ， 不 是 单 引 号 ， 束 是 键盘 中 通常 在 数字 1 左边 的 
那个 键 ， 在 瑞 文 半角 状态 下 输入 的 符号 。 这 种 方法 ， 在 编程 实践 中 较 少 
应 用 ， 特 别 是 在 Python 3 中 ， 己 经 把 这 种 方式 弃 绝 了 。 我 想 原 因 就 是 这 
个 符号 太 容易 和 单 引号 混淆 了， 且 在 编程 中 也 不 容易 看 出 来 ， 可 读 性 太 


A 

















常言 道 :“ 困 难 只 有 一 个 ， 但 解决 困难 的 方法 不 止 一 种 ”"， 既 然 反 引 
号 的 司 合 竹 不 好 ， 在 编程 实践 中 就 尽量 不 要 使 用 。 于 是 平 就 有 了 下 面 的 
2 这 是 被 广泛 采用 的 。 不 仅 简单 ， 更 主要 的 是 直 白 ， 让 人 一 看 就 
懂 。 











>>> print b + str(a) 
free1989 


用 str (a) 实现 将 整数 对 象 转换 为 子 符 串 对 象 。 昌 然 str 是 一 种 对 象 
类 型 ， 但 是 它 也 能 够 实现 对 象 类 型 的 转换 ， 这 就 起 到 了 一 个 函数 的 作 
用 。 其 实 前 面 已 经 讲 过 的 int 也 有 类 似 的 作用 ， 比 如 : 


>>> a = "250" 
>>> type(a) 
<type 'str'> 
>>> b = int(a) 
>>> b 

250 

>>> type(b) 
<type 'int'> 


如 果 你 对 int 和 str 比 较 好 奇 ， 可 以 在 交互 模式 中 使 用 help (int) ， 学 


习 help (str) 可 以 碍 阅 相 关 的 其 他 资料 。 

看 本 书 的 时 候 ， 一 定 要 同时 打开 计算 机 ， 一 边 看 一 边 操作 才 不 睡 
觉 ， 尽 管 本 书 充满 了 "水 分 ”， 证 你 难以 入 睡 ， 但 是 这 种 不 是 小 说 的 书 
籍 ， 总 是 在 催眠 上 有 很 好 疗效 的 。 


还 有 第 三 种 : 


>>> print b + repr(a)  #repr(a) 与 上 面 的 类 似 


free1989 


这 里 repr() 是 一 个 函数 ， 其 实 就 是 反 引 写 的 亚 代 品 ， 它 能 够 把 结果 
字符 串 转 化 为 合法 的 Python 表 达 式 。 


可 能 读者 这 时 候 心 存疑 惑 ， 它 们 三 者 之 间 有 区 别 吗 ? 首先 明确 ， 
reprO 和 ”~ 是 一 致 的 ， 就 不 用 区 别 了 。 接 下 来 需要 区 别 的 束 是 repr0 和 
str， 一 个 最 简单 的 区 别 : repr 是 函数 ，str 跟 int 一 样 是 一 种 对 象 类 型 。 不 
过 ， 仅 这 么 说 是 不 能 完全 解 惑 的 ， 科 亏 有 Google 让 我 奏 使 用 ， 你 会 找到 
很 多 人 对 这 两 者 进行 区 分 的 内 容 ， 我 推荐 以 下 这 些 : 








1.When Should i use str()and when should i use repr()? 
Almost always use str when creating output for end users. 


repr is mainly useful for debugging and exploring.For example, if you 
suspect a string has non printing characters in it, or a float has a small 
rounding error, repr will show you;str may not. 


repr can also be useful for for generating literals to paste into your 
source code.It can also be used for persistence (with ast.literal_eval or 
eval) ，bnut this is rarely a good idea--if you want editable persisted 
values, something like JSON or YAML is much better, and if you don't 
plan to edit them, use pickle. 


2.In which cases i can use either of them? 


Well, you can use them almost anywhere.You shouldn't generally use 


them except as described above. 

3.What can str()do which repr()can't? 

Give you output fit for end-user consumption--not always (e.g., 
str (['spam', 'eggs']) isn't likely to be anything you want to put in a 
GUI) ，but more often than repr. 


4.What can repr()do which str()can't 


Give you output that's useful for debugging--again, notalways (the 
default for instances of user-created classes is rarely helpful ) , but 
whenever possible. 


And sometimes give you output that's a valid Python literal or other 
expression--but you rarely want to rely on that except for interactive 
exploration. 


以 上 英文 内 容 来 源 : 
http://stackoverflow.com/questions/19331404/str-vs-repr-functions-in- 


python-2-7-5。 


15d4 扩军 件 





在 字符 串 中 ， 有 时 需要 输入 一 些 特 殊 的 符号 ， 但 是 ， 东 些 符号 不 能 
直接 和 输 出， 就 需要 用 转 义 符 。 所 谓 转 义 ， 吏 是 不 采用 符号 本 来 的 含义 ， 
而 采用 另外 一 种 含义 。 下 面 列 出 利用 的 转 义 符 ， 如 表 1-2 所 示 。 


表 1-2 常用 的 转 义 符 











(在 行 尾 时 ) 续 行 符 
反 斜 杠 符号 

单 引号 

双 引 号 

响 铃 

退 格 (Backspace) 


























换行 

纵向 制 表 符 

横向 制 表 符 

回 车 

换 页 

八进制 数 ，yy 代表 的 字符 ， 例 如 : \o12 代表 换行 
上 六 进 制 数 ，yy 代表 的 字符 ， 例 如 : \x0a 代表 换行 
其 他 的 字符 以 普通 格式 输出 





























以 上 所 有 转 义 符 ， 都 可 以 通过 交互 模式 下 print 来 测试 一 下 ， 感 受 实 
际 上 是 什么 样子 的 。 例 如 : 




















>>> print "hello.I am qiwsir.\ # 这 里 换行 ， 下 一 行 接续 


... My website is 'http://qiwsir.github.io'." 
hello.I am qiwsir.My website is 'http://qiwsir.github.io'. 
>>> print "you can connect me by qq\\weibo\\gmail" #\\ 是 为 了 要 后 面 那个 

















\ 
you can connect me by qq\weibo\gmail 








忆 要 自己 多 练习 ， 才 能 充分 理解 转 义 符 的 作用 。 


1.5.5 ”原始 字符 串 


用 转 义 符 能 够 让 字符 串 中 的 某 些 符号 表示 原来 的 含义 ， 而 不 是 被 解 
析 成 某 种 具有 特别 能 力 的 符号 。 为 了 说 话 简 单 ， 我 们 常 弟 把 那 种 每 个 字 
和 从 都 是 原始 含义 的 字符 串 说 成 原始 字符 串 ， 比 如 反 斜 杠 ， 其 不 会 被 看 作 
转 义 符 ， 束 是 一 个 反 斜 杠 。 





>>> print "I like \npython" 


I like 
python 


这 里 的 反 和 斜 杠 就 不 是 “ 反 和 斜 杜 ”的 原始 符号 含义 ， 而 是 和 后 面 的 no 一 
起 表示 换行 〈 转 义 了 ) 。 当 然 ， 这 似乎 没有 什么 太 大 影响 ， 但 有 时 候 可 
能 会 出 现 问题 ， 比 如 打印 DOS 路 径 。 





>>> dos = "c:\News" 

>>> dos 

'c:Nnews' # 这 里 貌似 没有 什么 问题 
>>> print dos # 当 用 


print 来 打印 这 个 字符 串 的 时 候 就 出 问题 了 。 








C， 
ews 


如 何 避 免 ? 用 前 面 讲 过 的 转 义 符 可 以 解决 ， 读 者 试 一 下 。 


RS 0 要 不 然 就 真 的 “ 太 水 ”7 了 。 我 用 下 面 的 
方法 : 


>>> dos = r"c:\Nnews" 

>>> print dos 

c:\news 

>>> print r"c:\news\python" 
c:\news\python 


状 如 r"c:news"， 由 rr 开头 引 起 的 字符 串 就 是 声明 了 后 面 引号 里 的 东 
西 是 原始 字符 串 ， 在 里 面 放 任何 字符 都 表示 该 字符 的 原始 含义 。 


这 种 方法 在 做 网 站 设置 和 网 站 目录 结构 的 时 候 非常 有 用 ,使 用 了 原 
台 字 符 串 就 不 需要 转 义 了 。 





1.5.6 raw_input 和 Print 


小 孩 学 说 话 是 一 个 模仿 的 过 程 ， 周 围 的 人 说 什么 ， 孩 子 束 重复 什 








么 。 如 果 你 已 经 态 记 自己 当初 是 怎么 学 说 话 的 了 ， 那 么 就 找 个 小 孩子 观 
圭一 下 吧 ， 最 好 是 观察 自己 的 孩子 ， 如 果 没 有 ， 就 要 抓紧 了 。 


我 想 用 Python 实现 类 似 的 功能 。 


在 写 这 个 功能 前 ， 要 了 解 两 个 函数 : raw_input 〈 如 果 是 使 用 Python 
3.x， 请 转换 为 inputO0 ) 和 print。 


这 两 个 都 是 Python 的 内 建 函 数 〈built-in function) 。 关 于 Python 的 内 
建 函 数 ， 下 面 都 列 出 来 了 ， 供 参考 。 


abs()、divmod()、input()、open()、Sstaticmethod()、all()、 
enumerate()、int()、ord()、str()、any()、eval()、isinstance()、pow'()、 
sum()、basestring()、exectfile()、issubclass()、print()、super()、bin()、 
file()、iter()、property()、tuple()、bool()、filter()、len()、range()、 
type()、bytearray()、float()、list()、raw_input()、unichr()、callable()、 
format()、locals()、reduce()、unicode()、chr()、frozenset()、long()、 
reload()、vars()、dclassmethod()、getattr()、map()、repr()、xrange()、 
cmp()、globals()、max()、reversed()、zip()、compile()、hasattr()、 
memoryview()、round()、import()、complex()、hash()、min()、set()、 
apply()、delattr()、help()、next()、setattr()、buffer()、dict()、hex()、 
object()、slice()、coerce()、dir()、id()、oct()、sorted()、intern()。 


这 些 内 建 函 数 ， 怎 么 才能 知道 哪个 图 数 怎 么 用 ， 且 是 干什么 用 的 
呢 ? 

















曾 记 否 ? 前 面 使 用 过 的 方法 在 这 里 再 演示 一 裔 ， 这 种 方法 是 学 习 
Python 的 法 宝 。 


>>> help(raw_input) 


然后 束 出 现 : 


Help on built-in function raw_input in module __ builtin_ _: 
raw_input(...) 
raw_input([prompt]) -> string 


Read a string from standard input. The trailing newline is stripped. 

If the user hits EOF (Unix: Ctl-D, Windows: Ctl1-Z+Return), raise EOFError. 
On Unix, GNU readline is used if enabled. The prompt string, if given, 

is printed without a trailing newline before reading. 





是 不 是 已 经 清晰 地 看 到 了 raw_input() 的 使 用 方法 了 ? 


还 有 第 二 种 方法 ， 那 就 是 到 Python 的 官方 网 站 ， 查 看 内 建 函 数 的 说 
明 ， 网 址 : https://docs.python.org/2/library/functions.html。 


其 实 ， 上 面 列 出 内 建 永 数 名 称 ， 惑 是 在 这 个 网 页 中 抄 过 来 的 。 如 宋 
读者 愿意 跨越 发 展 ， 就 应 当 用 上 面 的 方法 把 每 个 内 建 函 数 怎么 使 用 、 返 
回 值 是 什么 等 都 查看 一 过， 做 到 心中 有 数 。 


进入 交互 模式 ， 操 练 一 番 : 





>>> raw_input("input your name:") 
input your name:python 
'python' 





人 返回 了 输入 的 内 容 ， 用 一 个 变量 可 以 获得 这 个 返 
回 值 。 


>>> name = raw_input("input your name:") 
input your name:python 

>>> name 

'python' 

>>> type(name) 

<type 'str'> 


而 且 ， 返 回 的 结果 是 str 类 型 。 如 果 输 入 的 是 数字 呢 ? 


>>> age = raw_input("How old are you?") 
How old are you?10 
>>> age 

1 


>>> type(age) 
<type 'str'> 


返回 的 结果 仍然 是 str 类 型 。 
再 试 试 print 〈 若 不 晓得 怎么 用 ， 可 以 用 help0O 去 看 看 ) 。 


>>> print "hello, world" 
hello, world 


>>> a = "python" 
>>> b 二 "good" 
>>> print a 
python 


>>> print a,b 
python good 


比较 简单 吧 。 


要 特别 提醒 的 是 ，print 的 返回 值 默认 是 以 m 结 尾 的 ， 所 以 ， 每 个 输 
出 语句 之 后 自动 换行 。 


有 了 以 上 两 个 准备 ， 接 下 来 束 可 以 写 一 个 能 够 “对 话 ” 的 小 程序 了 。 








#!/UsSr/bin/env python 
# coding=utf-8 


name = raw_input("What is your name?") 
age = raw_input("How old are you?") 


print "Your name is:", Name 
print "You are " + age + " years old." 


after_ten = int(age) + 10 
print "You will be " + str(after_ten) + " years old after ten years." 


对 这 段 小 程序 有 一 些 说 明 。 


前 面 演示 了 print 的 使 用 ， 除 了 打印 一 个 字符 串 之 外 ， 还 可 以 打印 字 
符 串 拼接 结果 。 


print "You are " + age + " years old." 
注意 ， 变 量 age 必须 是 字符 串 ， 如 最 后 的 那个 语句 中 : 


print "You will be " + Str(after_ten) + " years old after ten years." 


这 人 句 话 里 面 有 一 个 类 型 转化 ， 将 原本 是 整数 型 after_ten 转 化 为 了 str 
类 型 ， 否 则 就 会 报错 。 


同样 注意 ， 在 after_ten=int Cage) +10 中 ， 通 过 raw_input 得 到 的 是 str 
类 型 ， 当 age 和 10 求 和 的 时 候 ， 需 要 先 用 intO 函 数 进 行 类 型 转化 ， 才 能 和 
后 面 的 整数 10 相 加 。 


这 个 小 程序 基本 上 把 已 经 学 到 的 东西 综合 运用 了 一 次 。 请 读者 上 自行 
调试 一 下 ， 如 果 没 有 通过 ， 则 仔细 看 报错 信息 ， 你 能 够 从 中 获得 修改 方 
回 的 信息 。 


1.5.7 索引 和 切片 


字符 串 是 一 个 话题 中 心 ， 在 茶 些 朋友 的 程序 员 生 诈 中 ， 处 理 字符 串 
的 机 会 可 能 远 远 高 于 处 理 数 字 的 机 会 。 这 可 能 是 因为 现在 的 “程序 ” 越 来 
越 多 地 处 理 人 类 的 交往 信息 ， 所 以 高 级 编程 语言 也 越 来 越 多 地 处 理 字符 
串 了 。 


想 想 字 符 串 的 定义 ， 再 看 看 这 样 一 个 字符 串 “python”， 还 记得 前 面 
对 字符 串 的 定义 吗 ? 它 就 是 几 个 字符 〈(p、y、t h、o、n) 排列 起 来 。 
这 种 排列 是 非常 严格 的 ， 不 仅仅 是 字符 本 身 ， 而 且 还 有 顺序 ， 换 言 之 ， 
如 果菜 个 字符 换 了 ， 就 变 成 一 个 新 字符 串 了 ， 如果 这 些 字符 顺序 发 生 了 
变化 ， 则 也 将 成 为 一 个 新 字符 串 。 


在 Python 中 ， 把 像 字 符 串 这 样 的 对 象 类 型 (后 面 还 会 冒 出 来 类 似 的 
其 他 有 这 种 特点 的 对 象 类 型 ， 比 如 列表 ) 统称 为 序列 。 顾 名 思 义 ， 序 列 
就 是 “有 序 排列 ”。 


水 泊 梁 山 的 108 个 好 汉 里面 分 明 也 有 女 的 ， 难 道 女 汉 子 是 从 这 里 
来 的 吗 ? ) ， 束 是 一 个 “有 序 排列 ”的 序列 。 从 老大 宋江 一 直 排 到 第 108 
位 金毛 犬 段 景 住 。 在 这 个 序列 中 ， 每 个 人 有 编写 ， 编 号 和 每 个 人 一 一 对 
应 : 1 写 是 宋江 ，2 号 是 户 俊 义 。 有 反 过 来 ， 通 过 每 个 人 的 姓名 ， 也 能 找 出 
其 对 应 的 编号: 武松 是 多 少 写 ?14 写 。 李 迷 呢 ?22 号 。 


在 Python 中 ， 给 这 些 编号 取 了 一 个 文雅 的 名 字 ， 叫 作 索 引 《 别 的 编 
程 语 言 也 这 么 称呼 ， 不 是 Python 独 有 的 ) 。 




















>>> lang = "Study python" 
>>> lang[0] 


> lang[1] 
it! 
变量 lang 是 贴 在 字符 串 <study python” 上 的 标签 ， 如 果 要 得 到 这 个 字 
符 串 的 第 一 个 单词 98， 可 以 用 lang[0]。 


当然 ， 如 果 你 不 愿意 通过 赋值 语句 让 变量 lang 指 疝 那 个 字符 串 ， 也 
可 以 这 样 做 : 





>>> "study python"[0] 


SY 





效果 是 一 样 的 ， 但 是 方便 程度 显而易见 。 


字符 串 这 个 序列 的 排序 方法 跟 粱 山 好 汉 有 点 不 同 : 第 一 个 不 是 用 数 
字 1 表 示 ， 而 是 用 数字 0 表示 ， 其 他 很 多 语言 也 都 是 从 0 开始 排序 的 。 为 
什么 这 样 做 昵 ?” 这 束 是 规定 。 当 然 ， 这 个 规定 是 有 一 定 优 势 的 ， 此 处 不 
展开 ， 有 兴趣 的 读者 可 以 去 网 上 搜索 一 下 ， 有 专门 对 此 进行 解释 的 文 
草 。 











如 表 所 示 ， 将 这 个 字符 串 从 第 一 个 到 最 后 一 个 进行 了 排序 ， 特 别 注 
， 两 个 单词 中 间 的 那个 空格 ， 也 占用 了 一 个 位 置 。 


涡 








通过 索引 能 够 找到 该 索引 所 对 应 的 字符 ， 那 么 反 过 来 ， 能 不 能 通过 
字符 找到 其 在 字符 串 中 的 索引 值 呢 ?7 怎么 找 ? 


>>> lang.index("p") 





这 样 是 不 是 已 经 能 够 和 梁山 好 汉 的 例子 对 上 号 了 ? 只 不 过 区 别 在 于 
程序 的 第 一 个 索引 值 是 0。 


如 果 某 一 天 ， 宋 江 大 哥 站 在 大 石头 上 ， 癌 各 位 弟兄 大 喊 :“ 兄 第 
们 ， 都 排 好 队 。? 等 兄弟 们 排 好 之 后 ， 宋 江 说 :“ 现 在 给 各 位 没有 老 效 的 
见 第 分 配 女 朋友 ， 我 这 里 已 经 有 了 名 单 ， 我 仍 到 的 兄 第 站 出 来 ， 不 过 我 
0 











在 前 面 的 例子 中 lang[1] 能 够 得 到 原来 字符 串 的 第 二 个 字符 t， 束 相当 
于 从 原来 字符 串 中 把 这 个 “ 切 ” 出 来 了 。 不 过 ， 我 们 这 么 “ 切 ” 却 不 影响 原 
来 字符 串 的 完整 性 ， 当 然 也 可 以 理解 为 将 字符 t 复 制 一 份 拿 出 来 了 。 


类 似 宋江 大 哥 那 样 ， 一 次 性 将 几 个 兄 第 一 起 叫 出 来 ，Python 也 能 做 


到 。 





>>> lang 














'study python' # 在 前 面 “ 切 ”了 若干 的 字符 之 后 ， 再 看 一 下 该 字符 串 ， 还 是 完整 的 。 














>>> lang[2:9] 
‘Udy pyt' 


通过 lang[2:9] 要 得 到 多 个 (不 是 一 个 ) 字符 (来 源 于 原 字符 串 》， 
从 返回 的 结果 中 可 以 看 出 ， 我 们 得 到 的 是 序号 分 别 对 应 着 2、3、4、5、 
6、7、8《〈 跟 上 面 的 表格 对 应 一 下 ) 的 字符 〈 包 括 那个 空格 ) 。 

不 管 是 得 到 一 个 字符 还 是 多 个 字符 ， 通 过 索引 得 到 字符 的 过 程 都 称 
之 为 切片 。 


切片 是 一 个 很 有 意思 的 东西 ， 可 以 “ 切 ” 出 不 少 花 样 呢 。 














>>> lang 
"Study python' 
>>> b = lang[1:] # 得 到 从 

















1 号 到 最 末尾 的 字符 ， 这 时 最 后 那个 不 用 写 






































>>> b 

"tudy python' 

>>> c = lang[:] # 得 到 所 有 字符 
>>> c 

"Study python' 

>>> d = lang[:10] # 得 到 从 第 一 个 到 
10 号 之 前 的 字符 

>>> d 

"Study pyth 





在 获取 切片 的 时 候 ， 如 果 冒 号 的 前 面 或 者 后 面 的 序号 不 写 ， 则 表示 
两 边 的 茶 个 终点 位 置 ， 或 是 开头 ， 或 是 结尾 。 也 就 是 ，lang[:10] 的 效果 
和 1lang[0:10] 是 一 样 的 。 

>>> e = lang[0:10] 


>>> e 
"Study pyth 


那么 ，lang[1:] 和 lang[1:11] 效 果 一 样 吗 ? 请 思考 后 作答 。 


>>> lang[1:11] 
"tudy pytho 
>>> lang[1:] 
"tudy python 





答案 是 : 不 一 样 ， 你 思考 对 了 吗 ? 


在 “ 切 ” 字 符 的 时 候 ， 如 果 冒 号 后 面 有 数字 ， 所 得 到 的 切片 不 包含 该 
数字 所 对 应 的 字符 《前 包括 ， 后 不 包括 ) 。 那 么 ， 是 不 是 可 以 这 样 呢 ? 
lang[1:12] 不 包括 12 号 (事实 上 没有 12 号 ) ， 是 不 是 可 以 得 到 1 号 到 11 号 
对 应 的 字符 呢 ? 














>>> lang[1:12] 
"tudy python 
>>> lang[1:13] 
"tudy python 


末 然 结 末 和 猜测 的 一 样 ， 即 如 果 第 二 个 数字 大 于 字符 串 的 长 度 ， 得 
到 的 返回 结果 就 自动 到 最 大 长 度 位 置 终止 。 但 是 请 注意 ， 这 种 获得 切片 
的 做 法 在 编程 实践 中 是 不 提倡 的 。 特 别 是 如 果 后 面 要 用 到 循环 的 时 候 ， 
这 样 做 很 可 能 会 过 到 麻烦 。 


如 果 在 “切片 ”的 时 候 ， 冒 号 左右 都 不 写 数字 ， 就 是 前 面 所 操作 的 
c=]lang[:]， 其 结果 是 变量 c 的 值 与 原 字 符 串 一 样 ， 即 “复制 *» 了 一 份 。 注 
意 ， 这 里 的 “复制 ?打上 了 引号 ， 意 思 是 如 同 复制 ， 是 不 是 真 的 复制 呢 ? 
可 以 用 下 面 的 方式 检验 一 下 : 























>>> id(c) 

3071934536L 
>>> id(lang) 
3071934536L 


id0 的 作用 还 记得 吗 ? 
从 上 面 可 以 看 出 ， 两 个 内 存 地 址 一 样 ， 说 明 c 和 lang 两 个 变量 指 辐 的 


古 同 一 个 对 象 。 用 c=lang[:] 的 方式 并 没有 生成 一 个 新 的 字符 串 ， 而 是 将 
变量 c 这 个 标签 也 贴 在 了 原来 那个 字符 串 上 了 。 





>>> lang = "study python" 
>>> c = lang 





如 果 这 样 操作 ， 变 量 c 和 lang 是 不 是 指 同 同一 个 对 象 呢 ? 读者 可 以 上 自 
行 检验 。 


1.5.8 ”基本 操作 


所 有 序列 部 有 如 下 基本 操作 ， 字 符 串 是 序列 的 子 集 。 


len0: 返回 序列 长 度 。 

+: 连接 两 个 序列 。 

*: 重复 序列 元 素 。 

in: 判断 元 素 是 售 存 在 于 序列 中 。 

max(): 返回 最 大 值 。 

min0: 返回 最 小 值 。 

cmp (str1，str 2) : 比较 两 个 序列 值 是 否 相 同 。 


通过 下 面 的 例子 ， 将 这 几 个 基本 操作 在 字符 串 上 的 使 用 演示 一 下 。 


1) “+" 连 接 字符 串 








>>> Str1 = "abcd' 

>>> Str2 = "abcde' 

>>> Str1 + Str2 
"abcdabcde' 

>>> stri + "-->" + Str2 
'abcd-->abcde' 


不 要 小 看 “+” 写 ， 到 此 只 是 学 了 字符 串 这 一 种 序列 ， 后 面 还 会 过 到 
列表 、 元 组 两 种 序列 ， 痢 能 够 如 此 实现 拼接 。 


2) in 








>>> "a" In stri 
True 
>>> "de" in stri 
False 
>>> "de" in str2 


各 用 来 判断 某 个 字符 串 是 不 是 在 另外 一 个 字 答 串 内 ， 或 者 判断 某 个 
字符 串 内 是 否 包含 某 个 字符 串 ， 如 果 包 含 ， 束 返回 True， 人 否则 返回 
False。 








3) 最 值 


>>> max(str1) 
1d 
>>> max(str2) 
1 T 


e 
>>> min(str1) 
+ 


在 一 个 字符 串 中 ， 每 个 字符 在 计算 机 内 都 是 有 编码 的 ， 也 就 是 对 应 
着 一 个 数字 ，min0 和 max0 就 是 根据 这 些 数字 获得 最 小 值 和 最 大 值 ， 然 
后 对 应 出 相应 的 字符 。 关 于 这 种 编号 是 多 少 ， 可 以 搜索 有 关 字 符 编 码 或 
者 ASCII 编 码 ， 很 容易 查 到 。 


4) 比较 











>>> cmp(str1i, str2) 
= 





将 两 个 字符 串 进行 比较 ， 首 先 将 字符 串 中 的 符 写 转化 为 对 应 的 数字 
(怎么 对 应 数字 了 ? 请 参照 ASCII 理 解 ) ， 然 后 再 比较 。 如 果 返 回 的 数 
值 小 于 零 ， 说 明 第 一 个 小 于 第 二 个 ; 等 于 0， 则 两 个 数值 相等 ， 大 于 0， 
人 





>>> ord('a') 
97 
>>> ord('b') 
98 


>>> ord(' ') 
32 


ord0) 是 一 个 内 建 函 数 ， 能 够 返回 某 个 字符 (注意 ， 是 一 个 字符 ， 而 
不 是 多 个 字符 组 成 的 串 ) 所 对 应 的 ASCII 值 〈 是 十 进 制 的 ) ， 字 符 a 在 
ASCII 中 的 值 是 7， 空格 在 ASCI 中 也 有 值 ， 是 32。 反 过 来 ， 根 据 整 数 
值得 到 相应 字符 ， 可 以 使 用 chr0: 


>>> chr(97) 
六 


>>> chr(98) 
过 


于 是 ， 得 到 如 下 比较 结 


>>> cmp("a", "b") #a- ->97， 


b-->98, 


97 小 于 


98， 所 以 





a 小 于 


b。 


:小 
>>> cmp("abc", "aaa") 
1 


>>> cmp("a", "a") 


看 看 下 面 的 比较 是 怎么 进行 的 呢 ? 


>>> cmp("ad", "er) 
-1 


在 字符 串 的 比较 中 ， 两 个 字符 串 的 第 一 个 字符 先 比较 ， 如 果 相 等 ， 
束 比 较 下 一 个 ， 如 末 不 相等 ， 束 返 回 结果 。 如 果 直 到 最 后 还 相等 ， 就 返 
回 0。 位 数 不 够 时 ， 按 照 “ 没 有 ?处理 〈 注 意 , “没有 ?不 是 0，0 在 ASCII 中 
对 应 的 是 NUL) ， 位 数 多 的 那个 大 。ad 中 的 a 先 和 后 面 的 c 进 行 比较 ， 显 
然 a 小 于 c， 于 是 返回 结果 -1。 但 进行 下 面 的 比较 ， 是 最 容易 让 人 迷 范 
的 。 读 者 能 不 能 根据 刚才 阐述 的 比较 原理 理解 得 到 的 结果 呢 ? 




















>>> cmp("123", T2305) 
1 








>>> cmp(123,23) # 也 可 以 比较 整数 ， 这 时 候 就 是 整数 的 直接 比较 了 。 





5 ) 66 洲 ?? 


字符 串 中 的 “乘法 ”含义 是 重复 那个 字符 串 ， 在 杀 些 时 候 很 好 用 的 ， 
比如 要 打印 一 个 华丽 的 分 割 线 : 


>>> str1i * 3 
"abcdabcdabcd ' 
>>> print "-" * 20 # 不 用 输入 很 多 个 




















6) lenO 


要 知道 一 个 字符 串 有 多 少 个 字符 ， 一 种 方法 是 从 头 开始 盯 着 屏 大 
数 。 哦 ， 这 不 是 计算 机 在 干 活 ， 是 “ 键 客 ”在 干 活 。 


键 客 ， 不 是 剑客 。 剑 客 是 以 剑 为 武器 的 侠客 ， 而 键 客 是 以 键盘 为 武 
名 的 侠客 。 


计算 机 这 样 来 数字 符 串 长 度 : 





>>> a="hello" 
>>> len(a) 
5 


疯 数 len() 返 回 该 字符 串 长 度 。 
>>> m = len(a) 


# 把 结果 返回 后 赋值 给 一 个 变量 








>>> Mm 

















5 
>>> type(m) # 这 个 返回 值 ( 变 量 ) 是 一 个 整数 型 











<type 'int'> 


1.59 种 用 的 备 符 第 方 优 





字符 串 的 方法 有 很 多 ， 可 以 通过 dir 来 查看 : 


>>> dir(str) 
['_add ', '_class ', '_ contains ', '_ delattr ', '_doc ', '_ eq _', 








这 么 多 字符 串 方 法 当然 不 用 都 介绍 ， 因 为 有 一 种 方法 ， 读 者 可 以 随 
用 随 查阅 每 不 字符 第 方法 是 如 何 使 用 的 ! 








>>> help(str.isalpha) 
Help on method_descriptor: 
isalpha(...) 
S.isalpha() -> bool 
Return True if all characters in S are alphabetic 
and there is at least one character in S, False otherwise. 


按照 这 里 的 说 明 ， 在 交互 模式 下 进行 实验 。 





>>> "python".isalpha() # 字 符 串 全 是 字母 ， 应 该 返回 
True 

True 

>>> "2python".isalpha() # 字 符 串 含 非 字母 ， 返 回 
False 

False 


以 下 仅 列 举 几 个 常用 的 方法 。 
1) splitO 
其 作用 是 将 字符 串 根 据 某 个 分 割 符 进行 分 割 。 


>>> a = "I LOVE PYTHON" 
>>> a.split(" ") 
['I', 'LOVE', 'PYTHON'] 


这 里 用 空格 作为 分 ?到 |， a 
关于 列表 的 内 容 ， 后 续 会 介绍 。 还 能 用 别 的 分 隅 吗 ? 


>>> b = "www.itdiffer.com" 
>>> b.split(".") 
[www'， "itdiffer'， "com '] 


2) 去 挥 字 符 串 两 头 的 空格 


比如 让 用 户 输入 一 些 信息 ， 有 的 用 户 有 时 候 会 在 信息 《比如 ， 目 己 
的 名 字 就 是 字符 串 ) 前 面 或 者 后 面 加 空格 。 这 些 空格 是 没 用 的 ， 在 使 用 





所 输入 的 信息 时 ， 必 须要 把 这 些 空格 去 掉 。 
Python 中 去 掉 空 格 的 方法 有 如 下 几 种 : 


S.strip(): 去 掉 字 符 串 的 左右 空格 











S.lstrip(): 去 掉 字 符 串 的 左边 空格 


S.rstrip(): 去 掉 字 符 串 的 右边 空格 


例如 : 


>>> b=" hello " # 两 边 有 空格 


>>> b.strip() 
"he11o 

>>> b 

' hello ' 


特别 注意 ， 原 来 的 值 没 有 变化 ， 而 是 新 返回 了 一 个 结果 。 


>>> b.1lstrip() # 去 掉 左边 的 空格 


'hello ' 
>>> b,rstrip() # 去 掉 右 边 的 空格 


' hello' 
3) 字符 大 小 写 的 转换 


英文 有 时 候 要 用 到 大 小 写 转换 。 最 有 名 的 是 驶 峰 命 名 ， 里 面 就 有 一 
些 大 写 和 小 写 。 如 有 果 有 兴趣 ， 可 以 来 这 里 学 习 目 动 将 字符 串 转 化 为 驼峰 
命名 形式 的 方法 (参见 : 
https://github.com/giwsir/algorithm/blob/master/string_to hump.md) 。 相 
关 的 方法 有 : 


S.upper() 
S.lowerl() 


S.capitalize() 
S.isupper() 
S.islower() 
S.istitle() 


看 例子 : 


>>> a = "qiwsir,python" 
>>> a.upper() # 将 小 写字 母 完 全 变 成 大 写字 母 











'QIWSIR, PYTHON， 
>>> a # 原 数据 对 象 并 没有 改变 

















'qiwsir,python' 
>>> b = a.upper() 




















>>> b 

'QIWSIR, PYTHON' 

>>> c = b.1lower() # 将 所 有 的 大 写字 母 变 成 小 写字 母 
>>> C 


'qiwsir,python' 


>>> a 
'qiwsir,python' 
>>> a.capitalize() # 把 字符 串 的 第 一 个 字母 变 成 大 写 








'Qiwsir,python' 


>>> a # 原 数据 对 象 没有 改变 




















'qiwsir,python' 

>>> b = a.capitalize() 
>>> b 

'Qiwsir,python' 


>>> a = "qiwsir,github" 
>>> a.istitle() 
False 


亲 
开 


>>> a = "QIWSIR" 当 全 是 大 写 的 时 候 ， 返 回 








False 
>>> a.istitle() 
False 


>>> a = "qdqIWSIR7" 
>>> a.istitle() 











False 

>>> a = "Qiwsir,github" # 如 果 这 样 ， 也 返回 
False 

>>> a.istitle() 

False 

>>> a = "Qiwsir" # 这 样 是 
True 

>>> a.istitle() 

True 

>>> a = 'Qiwsir,Github' # 这 样 也 是 
True 

>>> a.istitle() 

True 

>>> a = "Qiwsir" 

>>> a.isupper() 

False 

>>> a.upper().isupper() 

True 

>>> a.islower() 

False 

>>> a.lower().islower() 

True 

>>> a = "This is a Book" 

>>> a.istitle() 

False 


>>> b = a.title() # 这 样 就 把 所 有 单词 的 第 一 个 字母 转化 为 大 写 





























>>> b 
'This Is A Book' 
>>> b.istitle() # 判 断 每 个 单词 的 第 一 个 字母 是 否 为 大 写 


4) join 连接 字符 串 


用 “+ 能 够 连接 字符 串 ， 但 不 是 什么 情况 下 都 能 够 如 愿 。 比 如 ， 将 
列表 《列表 是 妃 外 一 种 类 型 ) 中 的 每 个 字符 《〈 串 ) 元 聚 拼 接 成 一 个 字符 
串 ， 并 且 用 杀 个 符号 连接 ， 但 如 果 用 “+” 会 比较 抹 烦 。 用 字符 串 的 join 方 
法 就 比较 容易 实现 。 





>>> b 
'www.itdiffer.com' 
>>> c = b.split(".") 
>>> C 


[www'， 'itdiffer', 'com'] 
>>> ".".join(c) 
"www.Itdiffer .com' 

mp "*", join(c ) 
'www*itdiffer*com' 


1.5.10 字符 串 格 式 化 输出 





什么 是 格式 化 ? 在 维基 百科 中 有 专门 的 词 条 ， 是 这 么 说 的 : 


格式 化 是 指 对 磁盘 或 磁盘 中 的 分 区 〈Partition ) 进行 初始 化 的 一 种 
操作 ， 这 种 操作 通 利 会 导致 现 有 的 磁盘 或 分 区 中 所 有 的 文件 被 清除 。 


不 知道 你 是 否 知道 这 种 “格式 化 "”。 显 然 ， 此 格式 化 非 我 们 这 里 所 说 
的 ， 我 们 说 的 是 字符 串 的 格式 化 ， 或 者 说 是 “格式 化 字符 串 ”*”， 表 示 的 意 


思 束 是 : 


格式 化 字符 串 ， 是 C、C++ 等 程序 设计 语言 Printf 类 函数 中 用 于 指定 
输出 参数 的 格式 与 相对 位 置 的 字符 串 参数 。 其 中 的 转换 说 明 
(conversion specification〉 用 于 把 随后 对 应 的 0 个 或 多 个 函数 参数 转换 
J ; 格式 化 字符 串 中 转换 说 明 以 外 的 其 他 字符 原样 输 


这 也 是 来 自 维 基 百 科 的 定义 。 在 这 个 定义 中 ， 用 C 语 言 作为 例子 ， 
并 且 用 了 其 输出 函数 来 说 明 。 在 Python 中 ， 也 有 同样 的 操作 和 类 似 的 函 
数 print， 此 前 我 们 已 经 了 解 一 二 了 。 


将 那个 定义 说 得 通俗 一 些 : 字符 串 格 式 化 就 是 要 先 制定 一 个 模板 ， 
在 这 个 模板 中 茶 个 或 者 茶几 个 地 方 留 出 空位 来 ， 然 后 在 那些 空位 填 上 字 
从 串 。 那 么 ， 那 些 空位 需要 用 一 个 符 写 来 表示 ， 这 个 符号 通 津 被 叫 作 占 
位 符 〔 仪 仅 是 占据 着 那个 位 置 ， 并 不 是 输出 的 内 容 〉。 














>>> "I like %s" 
'I like %s' 


在 这 个 字符 串 中 ， 有 一 个 符号 “%s”， 这 是 一 个 占 位 符 ， 可 以 被 其 他 
的 字符 串 代 丛 。 比 如 : 


>>> "I like %s" % "python" 
'I like python' 
>>> "I like %s" % "Pascal" 
'I like Pascal' 


这 是 较为 肖 用 的 一 种 字符 串 输 出 方式 。 


不 同 的 占 位 符 ， 表 示 那 个 位 置 应 该 被 不 同类 型 的 对 象 填充 ， 如 表 1- 
3 所 示 。 常 用 的 只 有 9%s、9%d 和 9%f， 如 果 需 要 其 他 的 ， 到 这 里 来 查 即 
可 。 


看 例子 : 


>>> a = "%d years" % 15 
>>> print a 
15 years 


表 1-3 占 位 符 








字符 串 ( 采 用 str0 的 显示 ) 














字符 串 (采用 repr0 的 显示 ) 





单个 字符 
- 进 制 整数 

上 进 制 整数 
指数 〈 底 数 为 e) 
浮 点 数 




















当然 ， 还 可 以 在 一 个 字符 串 中 设置 多 个 占 位 符 ， 就 像 下 面 一 样 : 


>>> print "Suzhou is more than %d years. %s lives in here." % (2500, "qiwsir") 
Suzhou is more than 2500 years. qiwsir lives in here. 


对 于 浮 点 数字 的 打印 输出 ， 还 可 以 限定 输出 的 小 数位 数 和 其 他 样 
式 : 

>>> print "Today's temperature is %.2f" % 12.235 

Today's temperature is 12.23 


>>> print "Today's temperature is %+.2f" % 12.235 
Today's temperature is +12.23 


注意 : 在 上 面 的 例子 中 ， 没 有 实现 四 舍 五 入 的 操作 ， 只 是 截取 ， 
但 是 上 面 的 例子 也 的 确 太 特殊 了 。 如 果 读 者 有 兴趣 ， 可 以 换 一 个 数 ， 目 


己 试 试 ， 在 一 般 情况 下 是 能 够 实现 四 舍 五 入 的 。 


关于 类 似 的 操作 还 有 很 多 变化 ， 比 如 输出 格式 的 宽度 是 多 少 等 。 如 
果 读 者 在 编程 中 遇 到 了 ， 可 以 到 网 上 查找 。 在 这 里 给 一 个 参考 图 示 ， 人 也 
是 从 网 上 下 载 的 ， 如 图 1-6 所 示 。 


数字 格式 描述 
3.1415926 {:.2 保留 小 数 点 后 两 位 
3.1415926 {:+.2 市 符号 保留 小 数 点 后 两 位 
-1 {:+.2} 融 符 号 保留 小 数 点 后 两 位 
2.71828 {:.0f} 

{:0>2d} 

{:x<4d} SXXX 

{x<4d} 10xx 
1000000 {:,} 1,000,000 
0.25 {:.2%} 25.00% 
1000000000{:.2e} 1.00e+09 


13 
13 
13 


{:10d} 
{:<10d} 
{:^10d} 


13 右 对 齐 (默认 , 宽度 为 10) 


中 间 对 齐 (宽度 为 10) 





图 1-6 ”字符 品格 式 


其 实 ， 上 面 这 种 格式 化 方法 ， 常 常 侯 认为 太 “ 上 古老 ”了 。 因 为 在 
Python 中 还 有 新 的 格式 化 方法 。 


>>> S1 = "I like {}".format("python") 


>>> si 

'I like python' 

>>> S2 = "Suzhou is more than {0} years. {1} lives in here.".format(2500, "qiwsir") 
>>> s2 


'Suzhou is more than 2500 years. qiwsir lives in here.' 


这 就 是 Python 非常 提倡 的 string.formatO 的 格式 化 方法 ， 其 中 全 作为 








这 种 方法 真得 非常 好 ， 而 且 非 党 简单 ， 只 需要 将 对 应 的 东西 按照 顺 
序 在 format 后 面 的 括号 中 排列 好 ， 分 别 对 应 占 位 符 介 即 可 。 


如 果 你 觉得 还 不 明确 ， 还 可 以 这 样 来 做 。 


>>> print "Suzhou is more than {year} years. {name} lives in here.".format(year=250 
Suzhou is more than 2500 years. qiwsir lives in here. 


真 的 很 简洁 、 优 雅 。 


还 有 一 种 格式 化 的 方法 是 “字典 格式 化 ”"， 这 里 仅仅 举 一 个 例子 ， 如 
果 读 者 要 了 解 “ 字 典 * 的 含义 ， 本 教程 后 续 会 有 的 。 


>>> lang = "python" 
>>> print "I love %(program)s" % {"program":lang} 
I love python 


这 里 列举 了 三 种 基本 格式 化 的 方法 ， 你 喜欢 那 种 ? 我 推荐 : 


string.format()。 


1.6 字符 编码 


在 Python 2.x 中 ， 字 符 编 码 是 一 个 让 人 困惑 的 问题 ， 这 个 问题 在 
Python 3.x 中 目 然 解决 了 。 由 此 可 以 说 ， 未 来 是 Python 3 的 。 但 是 ， 由 于 
前 面 已 经 分 析 过 的 原因 ， 在 一 段 时 间 内 Python 2.x 还 不 能 完全 丢 痉 ， 其 
至 不 少 工程 项 目 还 是 以 它 为 主 。 所 以 ， 还 要 将 字符 编码 问题 单独 叙述 。 


如 末 一 个 字符 串 都 是 瑞 文 ， 束 没有 所 谓 编码 问题 。 但 在 我 们 的 环境 
中 ， 中 文 是 我 们 不 得 不 用 的 。 








>>> name = ' 老 齐 


>>> name 
'\xe8\x80\x81\xe9\xbd\x90' 


你 在 交互 模式 中 过 到 过 上 面 的 情形 吗 ? 这 就 是 显示 汉字 的 问题 ， 英 
文 就 不 这 样 了 。 

难道 这 是 中 文 的 错 吗 ?看 来 投胎 真 的 是 一 个 技术 活 。 是 的 ， 投 胎 是 
技术 活 ， 但 上 面 的 问题 不 是 中 文 的 错 。 





1.6.1 编码 


什么 是 编码 ? 这 是 一 个 比较 玄 乎 的 问题 ， 也 不 好 下 一 个 普通 定义 。 
我 看 到 有 的 教材 中 有 定义 ， 且 不 数 说 其 定义 不 对 ， 但 至少 是 不 容易 理 
。 








“古代 打仗 ， 击 慌 进 攻 、 鸣 金 收 兵 ” 这 就 是 编码 。 把 要 传达 给 士兵 的 
命令 对 应 为 一 定 的 其 他 形式 ， 比 如 命令 “进攻 ”， 经 过 信息 传递 ， 如 图 1- 
7 所 示 。 


进攻 


痉 声 





图 1-7 信息 传递 
1) 长 官 下 达 进 攻 命 令 ， 传 令 员 将 这 个 命令 编码 为 鼓 声 。 


2) 避 声 在 空气 中 传播 ， 比 传令 员 的 嗓子 吼 出 来 的 声音 传播 得 更 
远 ， 士 兵 听 到 后 也 不 会 有 上 攻 义 ， 这 束 是 “进攻 ”命令 被 编码 成 轻声 之 后 的 
优势 所 在 。 


3) 士兵 昕 到 或 声 ， 束 是 接收 到 信息 ， 如 末 接 受过 训练 或 者 有 人 告 
诉 过 他 们 ， 他 们 就 知道 这 是 命令 进攻 ， 这 个 过 程 就 是 解码 。 所 以 ， 编 码 
方案 要 有 两 僚 : 一 僚 在 信息 发 出 者 那里 ， 男 外 一 套 在 信息 接受 者 这 里 。 
经 过 解码 之 后 ， 士 兵 明 白 了 才 行 动 。 


以 上 过 程 比较 人 简单， 但 真实 的 编码 和 解码 过 程 比 这 个 复杂 。 不 过 ， 
原理 都 差不多 。 


举 一 个 似乎 遥远 ， 其 实 不 久 前 人 们 都 在 使 用 的 东西 做 例子 : 电报 
(以 下 引用 的 内 容 来 自 《 维 基 百 科 》) 。 

















电报 是 通信 业务 的 一 种 ， 在 19 世 纪 初 发 明 ， 是 最 早 使 用 电 进 行 通 信 
的 方法 。 电 报 大 为 加 快 了 消息 的 流通 ， 是 工业 社会 的 一 项 重要 发 明 。 早 
期 的 电报 只 能 在 陆地 上 通信 ， 后 来 使 用 了 海底 电线 ， 开 展 了 越 洋 服务 。 
到 了 20 世 纪 初 ， 开 始 使 用 无 线 电 波 发 电报 ， 电 报 业 务 基本 上 已 能 抵达 地 
0 


中 国 出 现 首 条 电报 线路 是 1871 年 ， 由 英国 、 俄 国 及 丹麦 敷设 ， 从 中 
国 香港 经 上 海 至 日 本 长 崎 ， 且 是 海底 电 绕 。 由 于 清 政府 的 反对 ， 电 约 被 
禁止 在 上 海 登 录 。 后 来 丹麦 公司 不 理 清 政府 的 禁令 ， 将 线路 引 至 上 海 公 
共 租 界 ， 并 在 1871 年 6 月 3 日 起 开始 收发 电报 。 至 于 中 国 首 条 自主 数 设 的 
线路 ， 是 由 福建 巡抚 本 日 昌 在 中 国 台 湾 所 建 ，1877 年 10 月 完工 ， 连 接 台 
南 及 高 雄 。1879 年 ， 北 洋 大 丐 李鸿章 在 天 津 、 大 沽 及 北 塘 之 间架 设 电报 
线路 ， 用 作 军 事 通 信 。1880 年 ， 李 谎 章 奏 准 开办 电报 总 局 ， 由 盛 宣 怀 任 
总 办 。 并 在 1881 年 12 月 开通 天 津 至 上 海 的 电报 服务 。 李 鸿 章 说 :“ 五 年 
来 ， 我 国 创 设 沿 江 沿 海 各 省 电线 ， 总 计 一 万 多 里 ， 国 家 所 费 无 多 ， 巨 款 
来 自 民 间 。 当 时 正 值 法 人 挑 侠 ， 将 帅 报 告 盏 情 ， 朝 廷 传达 指示 ， 均 相机 
而 动 ， 无 丝 蝶 阻碍 。 中 国 自 古 用 兵 ， 从 未 如 此 神速 。 出 使 大 臣 往 来 问 
答 ， 于 发 夕 至 ， 相 隔 万 里 好 似 同 居 寿 院 。 举 设 电报 一 举 三 得 ， 既 防止 外 
敌 侵略 ， 又 加 强国 防 ， 亦 有 利于 商务 。” 天 津 官 电 局 于 庚 子 遭 乱 全 跨 。 
1887 年 ， 台 湾 巡 抚 刘 铭 传 敷设 了 福州 至 台湾 的 海底 电费， 是 中 国 首 条 海 
底 电 级。1884 年 ， 北 京 电 报 开 始 建设 ， 采 用 “ 安 设 双 线 ， 由 通州 展 至 京 
城 ， 以 一 端 引 入 署 中 ， 专递 官 信 ， 以 一 端 择 地 安置 用 便 商 民 ”， 8 月 5 
日 ， 电 报 线 路 开始 建设 ， 所 有 电线 杆 一 律 漆 成 红色 。8 月 22 日 ， 位 于 北 
京 尝 文 门 外 大 街 西 的 喜 更 胡同 的 外 城 商用 电报 局 开业 。 同 年 8 月 30 日 ， 
位 于 崇文 门 内 泡子 和 以 西 的 吕 公 向 开局 ， 专 门 收 发 官方 电报 。 

为 了 传达 汉字 ， 电 报 部 门 准 备 由 4 位 数字 或 3 位 罗马 字 构 成 的 代码 ， 
即 中 文 电码 ， 采 用 发 送 前 将 汉字 改写 成 电码 发 出 ， 收 电报 后 再 将 电码 改 
写成 汉字 的 方法 。 


注意 : 这 里 出 现 了 电报 中 用 的 “中 文 电码 ”这 束 古 一 种 编码 ， 将 汉 
字 对 应 成 阿拉 伯 数 字 ， 从 而 能 够 用 电报 发 送 汉 字 。 


1873 年 ， 法 国 驻 华 人 员 威 基 杰 参照 《 康 巾 字典 》 的 部 首 排 列 方法 ， 
挑选 了 常用 汉字 6800 多 个 ， 编 成 了 第 一 部 汉字 电码 本 《电报 新 书 》。 


电报 中 的 编码 被 称 为 摩尔 斯 电码 ， 英 文 是 Morse Code。 





















































摩尔 斯 电码 (英语 : Morse Code) 是 一 种 时 通 时 断 的 信号 代码 ， 通 
过 不 同 的 排列 顺序 来 表达 不 同 的 英文 字母 、 数 字 和 标点 符号 。 是 由 美国 
人 陕 纱 尔 :摩尔 斯 在 1836 年 发 明 。 


摩尔 斯 电码 是 一 种 早期 的 数字 化 通信 形式 ， 但 是 它 不 同 于 现代 只 使 
用 0 和 1 两 种 状态 的 二 进 制 代码 ， 它 的 代码 包括 五 种 : 点 〈(.) 、 划 
(-) 、 每 个 字符 间 短 的 停顿 “在 点 和 划 之 间 的 停顿 〉》、 每 个 词 之 间 中 
等 的 停顿 以 及 句子 之 间 长 的 俘 顿 。 


看 来 电报 员 是 一 个 技术 活 ， 不 同 长 短 的 停顿 都 代表 了 不 同意 思 。 
哦 ， 对 了 ， 有 一 个 老 片 子 叫 《 永 不 消逝 的 电波》， 保 证 你 看 完 之 后 才 知 
道 ， 里 面 根本 就 没有 讲 电报 是 怎么 编码 的 。 


摩尔 斯 电码 在 海事 通信 中 被 作为 国际 标准 一 直 使 用 到 1999 年 。1997 
年 ， 当 法 国 海 军 停止 使 用 摩尔 斯 电码 时 ， 发 送 的 最 后 一 条 消息 是 :“ 所 
有 人 注意 ， 这 是 我 们 在 永远 沉 彼 之 前 最 后 的 一 声呐 喊 ! ” 





























我 瞪 着 眼看 了 老 长 时 间 ， 这 两 行 不 是 一 样 的 吗 ”? 


不 管 这 个 了 ， 总 之 ， 这 就 是 编码 。 





1.6.2 计算 机 中 的 字符 编码 





抄 一 段 维基 百科 对 字符 编码 的 解释 : 


字符 编码 (英语 : Character Encoding) ， 也 称 为 字 集 码 ， 是 把 字符 
集中 的 字符 编码 为 指定 集合 中 某 一 对 象 〈 例 如 : 比特 模式 、 目 然 数 串 
行 、8 位 组 或 者 电 脉冲 ) ， 以 便 文 本 在 计算 机 中 存储 和 通过 通信 网 络 的 
传递 。 和 常见 的 例子 包括 将 拉丁 字母 表 编 码 成 摩 斯 电码 和 ASCIT。 其 中 ， 
ASCII 将 字母 、 数 字 和 其 他 符号 编号 ， 并 用 7 比特 的 二 进 制 来 表示 这 个 整 
数 。 通 常会 额外 使 用 一 个 扩充 的 比特 ， 以 便于 以 1 个 字 节 的 方式 存储 。 





在 计算 机 技术 发 展 的 早期 ， 如 ASCII (1963 年 ) 和 EBCDIC (1964 
年 ) 这 样 的 字符 集 逐 渐 成 为 标准 。 但 这 些 字 符 集 的 局 限 很 快 就 变 得 明 
显 ， 于 是 人 们 开发 了 许多 方法 来 扩展 它们 。 对 于 支持 包括 东亚 CJK 字 符 
家 族 在 内 的 写作 系统 的 要 求 能 支持 更 大 量 的 字符 ， 并 且 需 要 一 种 系统 而 
不 是 临时 的 方法 实现 这 些 字符 的 编码 。 


在 这 个 世界 上 ， 有 好 多 不 同 的 字符 编码 。 但 是 ， 它 们 不 是 自 己 随便 
搞 搞 的 ， 而 是 要 有 一 定 的 基础 ， 往 往 是 以 名 叫 ASCII 的 编码 为 基础 。 


ASCII (American Standard Code for Information Interchange， 美 国信 
奶 交 换 标准 代码 ) 是 基于 拉丁 字母 的 一 套 电脑 编码 系统 。 它 主要 用 于 显 
示 现 代 英 语 ， 而 其 扩展 版 本 EASCII 则 可 以 部 分 支持 其 他 西欧 语言 ， 并 
等 同 于 国际 标准 ISO/IEC 646。 由 于 万 维 网 使 得 ASCII 广 为 通用 ， 直 到 
2007 年 12 月 ， 逐 渐 被 Unicode 取 代 。 


上 面 的 引文 中 已 经 说 了 ， 现 在 我 们 用 的 编码 标准 已 经 变 成 Unicode 
了 《Python3.x 就 是 用 了 Unicode) ， 那 么 什么 是 Unicode 呢 ? 还 是 抄 一 段 
来 自 维 基 百 科 的 说 明 : 


Unicode 中文: 万 国 码 、 国 际 码 、 统 一 码 、 单 一 码 ) 是 计算 机 科 
学 领域 里 的 一 项 业界 标准 。 它 对 世界 上 大 部 分 的 文字 系统 进行 了 整理 、 
编码 ， 使 得 电脑 可 以 用 更 为 简单 的 方式 来 呈现 和 人 处理 文字 。 


Unicode 伴 随 着 通用 字符 集 的 标准 而 发 展 ， 同 时 也 以 书本 的 形式 对 
外 发 表 。Unicode 至 今 仍 在 不 断 增 修 ， 每 个 新 版 本 都 加 入 更 多 新 的 字 
符 。 目 前 最 新 的 版 本 为 7.0.0， 己 收入 超过 十 万 个 字符 (第 十 万 个 字符 在 
2005 年 获 采纳 ) 。Unicode 涵 盖 的 数据 除了 视觉 上 的 字形 、 编 码 方法 、 
标准 的 字符 编码 外 ， 还 包含 了 字符 特性 ， 如 大 小 写字 母 。 


听 这 名 字 : 万 国 码 ， 那 就 一 定 包 含 了 中 文 。 但 是 ， 光 有 一 个 
Unicode 还 是 不 够 用 (可 以 访问 《维基 百科 》 网 站 查看 相关 说 明 〉 ， 还 
要 有 其 他 的 一 些 编码 实现 方式 ，Unicode 的 实现 方式 称 为 Unicode 转 换 格 
式 〈Unicode Transformation Format， 人 简称 为 UTFE) ， 于 是 和平 有 了 一 个 我 
们 在 很 多 时 候 都 会 看 到 的 utf-8。 


什么 是 utf-8? 还 是 看 维基 百科 上 怎么 说 的 吧 : 


UTF-8 (8-bit Unicode Transformation Format) 是 一 种 针对 Unicode 

































































的 可 变 长 度 字符 编码 ， 也 是 一 种 前 级 码 。 它 可 以 用 来 表示 Unicode 标 准 

中 的 任何 人 字符， 且 其 编码 中 的 第 一 个 字 市 仍 与 ASCII 兼 容 ， 这 使 得 原来 

处 理 ASCII 字 符 的 软件 不 需要 或 只 做 少 部 份 修改 ， 即 可 继续 使 用 。 

A 网 页 及 其 他 存储 或 发 送 文字 的 应 用 中 优先 采 
J 编 后。 


征 不 定理 解 了 呢 ? 前 面 写 程序 的 时 候 ， 曾经 出 现 过 coding:utf-8 的 字 
样 ， 就 是 在 告诉 Python 我 们 要 用 什么 字符 编码 。 











1.6.3 encode 和 decode 


encode() 和 decode() 是 两 个 内 置 函数 。 


codecs.encode (obj[, encoding[, errors]]) :Encodes obj using the 
codec registered for encoding. 


codecs.decode (obj[, encoding[, errors]]) :Decodes obj using the 
codec registered for encoding. 


Python2 默 认 的 编码 是 ASCII， 通 过 encode0 可 以 将 对 象 的 编码 转换 
为 指定 编码 格式 〈 称 作 “ 编 码 ?) ， 而 decode 是 这 个 过 程 的 逆 过 程 〈 称 
作 “ 解 码 ”) 。 

做 一 个 实验 ， 才 能 理解 : 


SSS A 三 是 | 





>>> type(a) 
<type 'str'> 
>>> a 
'\xe4\xb8\xad' 
>>> len(a) 

3 


>>> b = a.decode() 
>>> b 

U' NuU4e2d ' 

>>> type(b) 

<type unicode '> 
>>> len(b) 

工 











在 做 这 个 实验 之 前 ， 或 许 还 不 是 很 迷 藻 (知道 得 越 多 越 迷 茫 ) ， 实 
验 做 完了 ， 自 己 也 迷 薄 了 。 别 急躁 ， 对 编码 问题 的 理解 要 慢 慢 来 ， 如 果 
一 时 理解 不 了 ， 就 先 按照 要 求 做 ， 做 痢 做 独 束 粗 然 开明 了 。 


变量 a 引 用 了 一 个 字符 串 类 型 对 象 ， 但 严格 地 讲 是 字 节 串 ， 因 为 它 
是 经 过 编码 后 的 字 节 组 成 的 序列 。 也 束 是 你 在 上 面 的 实验 中 看 到 
的 “中 ”这 个 字 在 计算 机 中 编码 之 后 的 字 节 表示 。 (关于 字 节 可 以 搜索 一 
下 ) 。 用 len (a) 来 度量 它 的 长 度 ， 它 是 由 三 个 字 节 组 成 的 。 

然后 通过 decode 函 数 将 字 节 串 转 变 为 字符 串 ， 并 且 这 个 字符 串 是 按 
照 Unicode 编 码 的 。 在 Unicode 编 码 中 ， 一 个 汉字 对 应 一 个 字符 ， 这 时 候 
度量 它 的 长 度 就 是 1。 


反 过 来 ， 一 个 Unicode 编 码 的 字符 串 也 可 以 转换 为 字 节 串 。 























>>> c = b.encode( ' utf-8 ') 
>>> C 

'\xe4\xb8\xad' 

>>> type(c) 

<type 'str'> 

>>> C == a 


关于 编码 问题 先 到 这 里 点 到 为 止 吧 。 因 为 再 扯 ， 还 会 扯 出 问题 来 ， 
读者 肯定 感到 不 满意 ， 因 为 还 没有 知 其 所 以 然 。 


1.6.4 ”避免 中 文 是 乱码 


“避免 中 文 是 乱码 ”是 一 个 具有 很 强 操作 性 的 问题 。 
首先 ， 提 倡 使 用 utf-8 编 码 方案 ， 因 为 它 跨 平 台 不 错 。 
经 验 一 ， 在 开头 声明 : 

# -+ Coding: utf-8 -*- 


有 朋友 问 我 “-*-”* 有 什么 作用 ， 那 个 就 是 为 了 好 看 ， 爱 美 之 心 人 和 皆 
有 ， 更 何况 程序 员 ? 当然 ， 也 可 以 写成 : 





# coding:utf-8 


经 验 二 ， 遇 到 字符 《〈 节 ) 串 ， 立 刻 转化 为 unicode， 不 要 用 str0， 直 


接 使 用 unicode(): 


unicode_str = unicode(' 中 文 


', encoding='utf-8') 
print unicode_str.encode('utf-8') 


经 验 三 ， 如 果 对 文件 操作 ， 打 开 文 件 的 时 候 ， 最 好 用 codecs.open 蔡 
代 open〔 关 于 文件 的 操作 ， 请 参阅 后 续 内 容 。) 


import codecs 
codecs.open('filename', encoding="'utf8"') 


点 。 


YY 


最 后 ， 如 宁 用 Python3， 这 种 编码 的 烦恼 会 少 一， 


1.7 列表 


此 前 ， 已 经 知道 了 三 种 Python 的 对 象 类 型 : int、float 和 str。 


这 一 节 中 的 list 类 型 ， 也 是 Python 的 一 种 对 象 类 型 ， 翻 译 为 : 列表 。 
下 面 的 加 粗 字 ， 请 读者 注意 : 


list 在 Python 中 具有 非常 强大 的 功能 。 








i171 是 党 


在 Python 中 ， 用 方 括号 表示 一 个 list: [] 


方 括号 里 面 的 元 素 类 型 ， 可 以 是 int， 也 可 以 是 str 类 型 的 数据 ， 甚 至 
也 能 够 是 True/False 这 种 布尔 值 。 看 下 面 的 例子 ， 要 特别 注意 阅读 注 
释 。 


>>> a=[] # 定 义 了 一 个 空 的 列表 ， 变 量 

















a 相当 于 一 个 贴 在 其 上 的 标签 











>>> type(a) 
<type 'list'> # 用 内 置 函数 
































type( ) 查 看 变量 




















a 引用 对 象 的 类 型 ， 为 











list 
>>> bool(a) # 用 内 置 函数 



































bool( ) 看 看 








a 的 布尔 值 ， 因 为 是 空 的 ， 所 以 为 











False 
False 
>>> print a # 打 印 


[] 


bool0 是 一 个 布尔 函数 ， 在 后 续 章 节 会 详 述 。 它 的 作用 就 是 来 判断 
一 个 对 象 是 “ 真 ? 还 是 “ 假 ”〈 空 ) 。 如 果 像 上 面 的 例子 那样 ， 列 表 中 什么 
0 


不 能 总 玩 “ 空 "的 ， 来 点 “ 实 ” 的 吧 。 


>>> a=['2'，3，'dqiwsir,.github.io'] 
>>> a 

['2', 3, 'qiwsir.github.io'] 

>>> type(a) 

<type 'list'> 

>>> bool(a) 

True 

>>> print a 

['2', 3, 'qiwsir.github.io'] 





一 个 列表 中 能 够 容纳 多 少 东 西 ?“ 有 容 乃 大 ”是 对 列表 最 好 的 形容 
了 ， 它 的 大 小 仅 受 制 于 硬件 设备 和 你 的 意愿 。 


如 果 你 已 经 了 解 了 别 的 语言 ， 比 如 比较 常见 的 Java， 里 面 有 一 个 跟 
list 相 似 的 数据 类 型 数组 但 是 两 者 还 是 有 区 别 的 。 在 Java 中 ， 数 
组 中 的 元 素 必 须 是 基本 数据 类 型 中 的 某 一 个 ， 也 就 是 要 么 都 是 int 类 型 ， 
要 么 都 是 char 类 型 等 ， 不 能 一 个 数组 中 既 有 int 类 型 又 有 char 类 型 。 这 是 
因为 Java 中 的 数组 需要 提前 声明 ， 声 明 的 时 候 就 确定 了 里 面 元 素 的 类 
型 。 但 是 尽管 Python 中 的 list 与 Java 中 的 数组 有 类 似 的 地 方 一 一 都 是 [] 包 
里 的 list 中 的 元 素 是 任意 类 型 的 ， 可 以 是 int、str， 还 可 以 是 list， 甚 
至 是 dict 等 。 所 以 ， 有 一 句 话说 : 列表 是 Python 中 的 苦力 ， 什 么 都 可 以 
Te 
































1.7.2 ”索引 和 切片 





关于 索引 和 切片 的 含义 在 字符 串 革 市 已 经 熟知 了 。 所 以 ， 这 里 可 以 
很 快 用 起 来 。 


>>> Url = "qiwsir.github.io" 
>>> ur1l[2] 
Iw!' 


>>> url[:4] 
'qiws' 

>>> url[3:9] 
'Ssir.gi' 





在 列表 中 也 有 类 似 的 操作 。 只 不 过 是 以 元 素 为 单位 ， 而 不 是 以 字符 
为 单位 进行 索引 。 


['2', 3, 'qiwsir.github.io'] 
>>> a[90] # 索 引 序号 也 是 从 











0 开始 





有 
>>> a[1] 
3 


[3, 'qiwsir.github.io'] 


列表 和 字符 串 两 种 类 型 都 属于 序列 《都 是 一 些 对 象 按 照 某 个 次 序 排 
列 起 来 ， 这 是 序列 的 最 大 特征 )， 因 此 ， 他 们 有 很 多 类 似 的 地 方 。 如 刚 
才 演 示 的 索引 和 切片 是 非常 一 致 的 。 


>>> lang = "python" 

>>> lang.index("y") 

1 

>>> lst = ['python','java','c++'] 
>>> lst.index('java') 

1 


索引 数字 从 左边 开始 编号 ， 第 一 个 是 0， 然 后 依次 增加 1。 





此 外 ， 还 有 一 种 编号 方式 是 从 右边 开始 ， 右 边 第 一 个 可 以 编号 
为 -1， 然 后 向 左 依次 是 : -2，-3，...， 依 次 类 推 下 来 。 这 对 字符 串 、 列 
表 等 各 种 序列 类 型 都 适用 。 


>>> lang 
"python'， 

>>> lang[-1] 
nt 


>>> lst 

['python', 'java', "c++ '] 
>>> lst[-1] 

1'c++! 





从 石 边 开 始 编 号 ， 第 -1 写 是 右边 第 一 个 。 但 是 ， 如 果 要 切片 的 话 ， 
应 该 注意 : 


>>> lang[-1:-3] 


>>> lang[-3:-1] 
'ho' 

>>> lst[-3:-1] 
['python', 'java'] 


序列 的 切片 ， 一 定 要 左边 的 数字 小 于 右边 的 数字 ，lang[-1:-3] 就 没 
有 刘 守 这 个 规则 ， 返 回 的 是 一 个 空 。 


1.7.3 反 转 


反 转 在 编程 中 常常 会 用 到 。 通 过 举例 来 说 明 反 转 的 方法 : 


>>> alst = [1,2,3,4,5,6] 
>>> alst[::-1] 

[6, 5, 4, 3, 2, 1] 

>>> alst 

[1, 2, 3, 4, 5, 6] 


当然 ， 对 于 字符 串 也 可 以 : 


>>> lang 
'python' 
>>> lang[::-1] 
'nohtyp' 
>>> lang 
'python' 





评 全 注意 到 ， 个 管 十 str 还 是 ]st， 肥 转 之 后 原来 的 值 没有 改变 。 这 嗣 
说 明 ， 这 里 的 反 转 ， 不 是 在 “ 原 地 * 把 原来 的 什 合 过 来 ， 而 是 新 生成 了 一 
个 值 ， 生 成 的 值 跟 原来 的 值 相 比 ， 是 倒 过 来 了 。 








这 是 一 种 非常 简单 的 方法 ， 虽 然 我 在 写 程序 的 时 候 常 常 使用， 但 并 
不 是 十 分 推荐 ， 因 为 它 有 时 候 让 人 感觉 迷茫 。Python 还 有 另外 一 种 方法 
让 list 反 转 ， 且 比较 容易 理解 和 阅读 ， 特 别 推荐 之 : 


>>> list(reversed(alst)) 
[6, 5, 4, 3, 2, 1] 


这 个 比较 简单 ， 而 且 很 容易 看 履 ， 不 是 吗 ? 
顺便 给 出 reversed 函 数 的 详细 说 明 : 





>>> help(reversed) 
Help on class reversed in module _ builtin : 


class reversed(object) 
| reversed(sequence) -> reverse iterator over values of the sequence 


| Return a reverse iterator 


它 返 回 一 个 可 以 欠 代 的 对 象 〈 关 于 友 代 的 问题 ， 请 参阅 后 续 内 
容 ) ， 不 过 已 经 将 原来 的 序列 对 象 反 转 了 。 比 如 : 





>>> 2 'abcd")) 
[Ld', "ce bb a'] 


很 好 、 很 强大 ， 特 别 推荐 使 用 。 
1.7.4 对 list 的 操作 


在 字符 串 那 部 分 已 经 提 到 过 ， 所 有 的 序列 都 有 几 种 基本 操作 。 列 表 
是 一 种 序列 ， 当 然 如 此 。 


1.len() 


>>> lst 

['python', 'java', "c++ '] 
>>> len(lst) 

3 


2.+， 连 接 两 个 序列 


>>> lst 

['python', 'java', "c++ '] 

>>> alst 

[1, 2, 3, 4, 5, 6] 

>>> lst + alst 

['python', 'java', 'c++', 1, 2, 3, 4, 5, 6] 


3 二 重复 元 索 


>>> lst 
['python', 'java', "c++ '] 
>>> lst * 3 


['python', 'java', 'c++', 'python', 'java', 'c++', ‘'python', 


4.in 


列表 Ist 还 是 前 面 的 值 : 





>>> "python" in lst 


True 

>>> "c#" in lst 

False 
5.max() 和 min() 


以 int 类 型 元 素 为 例 : 


>>> alst 
[1, 2, 3, 4, 5, 6] 
>>> max(alst) 


>>> min(alst) 
1 

>>> max(lst) 
'python' 


>>> min(lst) 
1'c++! 


6.cmp() 


'java', 


'c+t+'"] 


采用 上 面 的 方法 ， 进 行 比较 : 


>>> lsta = [2,3] 
>>> lstb = [2,4] 
>>> cmp(lsta,1stb) 


>>> lstc = [2] 

>>> cmp(1lsta,1stc) 
>>> lstd = ['2','3'] 
>>> cmp(lsta,1std) 


7. 追 加 元 素 


>>> a 二 ["good", "python", "I"] 
>>> a 

['good', 'python', 'I'] 

>>> a.append("like") # 回 


list 中 添加 





str 类 型 


"like" 
>>> a 
['good', 'python', 'I', 'like'] 
>>> a.append(100) # 问 


list 中 添加 





int 类 型 


100 
>>> a 
['good', 'python', 'I', 'like', 100] 


官方 文档 这 样 描述 list.append() 方 法 : 


list.append(x) 
Add an item to the end of the list; equivalent to a[len(a):] = [x]. 


是 否 已 经 理解 了 list.append (x) 的 含义 呢 ? 即 将 新 的 元 素 x 奶 加 到 
list 的 尾部 。 


如 果 注 意 看 上 面 官方 文档 中 的 那 句 话 ， 应 该 注意 到 后 面 半 句 : 
equivalent to allen (a) :]=[x]， 意 思 是 说 list.append (x) 等 效 于 
allen (a) :]=[x]。 这 也 相当 于 告诉 我 们 男 外 一 种 奶 加 元 素 的 方法 ， 并 且 
两 种 方法 等 效 。 





>>> a 
['good', 'python', 'I', 'like', 100] 
>>> a[len(a):]=[3] #len(a), 即 得 到 


list 的 长 度 ， 这 个 长 度 是 指 


list 中 的 元 素 个 数 。 


>>> a 
['good', 'python', 'I', 'like', 100, 3] 

>>> len(a) 

>>> a[6:]=['xxoo'] 

>>> a 

['good', 'python', 'I', 'like', 100, 3, 'xxoo'] 


1.7.5 列表 的 函数 


什么 是 方法 ? 方法 和 函数 有 什么 区 别 ? 这 里 暂 不 区 分 和 人 解释。 请 把 
这 个 名 词 “方法 ”抽象 出 来 ， 等 到 后 面目 然 明了 下 面 的 内 容 中 ， 没 有 区 
分 “函数 ”和 “方法 ”， 读 者 不 要 介意 这 个 名 词 )。 


, 列表 是 Python 中 的 苦力 ， 那 么 它 都 有 哪些 函数 呢 ? 或 者 对 它 能 做 什 
么 昵 ? 


>>> dir(Jist) 
['_add ', '_class ', '_ contains ', '_ delattr ', '_ delitem ', "delsl 





上 面 的 结果 中 ， 以 双 下 画 线 开 始 和 结尾 的 暂时 不 管 ， 如 
_ add _ 《以 后 会 管 的 ) 。 就 剩 下 以 下 几 个 了 : 





"append'， "count '， 'extend', 'index', 'insert', 'pop', 'remove', 'reverse', 'sort' 





下 面 对 这 些 函 数 进行 说 明和 演示 ， 这 都 是 在 编程 实践 中 常常 要 用 到 


的 。 


1.append 和 extend 


前 面 提 到 的 列表 基本 操作 中 有 list.append (x) ， 也 就 是 将 某 个 元 素 
X 退 加 到 已 知 的 一 个 列表 的 尾部 。 


除了 将 元 素 奶 加 到 列表 中 ， 还 能 够 将 两 个 列表 合并 ， 或 者 说 将 一 个 
2 按照 惯例 ， 首 先 还 是 看 官方 文档 中 的 描 
人 丰 : 














list.extend(L) 
Extend the list by appending all the items in the given list; equivalent to a[len(a 


Buns 阅读 本 书 的 朋友 提供 一 个 成 为 优秀 程序 员 的 必 备 : 看 官 
方 文档 。 


将 官方 文档 的 这 句 话 翻译 过 来 : 
通过 将 所 有 元 素 奶 加 到 已 知 list 来 扩充 它 ， 相 当 于 aflen (a) :]=L 
英语 太 烂 ， 翻 译 太 差 。 直 接 看 例子 ， 更 明白 : 


>>> la 

[1, 2, 3] 

>>> 1b 

['qiwsir', 'python'] 

>>> la.extend(1b) 

>>> la 

[1, 2, 3, 'giwsir', 'python'] 
>>> 1b 

['qiwsir', 'python'] 





上 面 的 例子 显示 有 两 个 list， 一 个 是 la， 另 外 一 个 是 Ilb， 将 jb 这 个 
列表 extend 到 la 的 后 面 ， 也 就 是 把 lb 中 的 所 有 元 素 加 入 到 la 中 ， 即 让 la 扩 - 


学 程序 一 定 要 有 好 奇 心 ， 我 在 交互 环境 中 经 癌 实 验 目 己 的 想法 ， 有 
时 甚至 是 比较 愚 奏 的 想法 。 





>>> la = [1,2,3] 
>>> b = "abcn 


>>> la.extend(b) 
>>> la 
[1, 2, 3, 'a', 'b', 'c'] 


>>> la.extend(c) 

Traceback (most recent call last): 
File "<stdin>", line 1, in <module> 
TypeError: 'int' object is not iterable 





从 上 面 的 实验 中 ， 你 和 E 够 有 什么 ， 心得 ? 原来 ， 如 果 操 作 
extend (str) 的 时 候 ，str 被 以 字符 为 单位 拆 开 ， 然 后 追加 到 la 里 面 。 


如 果 extend 的 对 象 是 数值 型 ， 则 报错 。 


所 以 ，extend 的 对 象 是 一 个 list， 如 果 是 str， 则 Python 会 先 把 它 按照 
字符 为 单位 转化 为 list 再 追加 到 已 知 ]ist。 


别 忘 记 了 前 面 官方 文档 的 后 半 人 句 话 ， 它 的 意思 


>>> la 

[1, 2, 3, Ra "b | 

>>> 1b 

['qiwsir', 'python'] 

>>> la[len(1a):]=1lb 

>>> la 

[1, 2, 3, 'a', 'b', 'c', 'giwsir', 'python'] 


list.extend (L) 等 效 于 ]ist[len (list):]=L, 工 是 待 并 入 的 list。 


概括 起 来 ，extend 函 数 也 是 将 男 外 的 元 素 增 加 到 一 个 已 知 列表 中 ， 
元 素 必 须 是 iterable， 什 么 是 iterable? 


iterable， 中 文 含义 是 “可 迭代 的 >”。 在 Python 中 还 有 一 个 词 ， 就 是 
iterator， 这 个 叫 作 “迭代 器 ”， 这 两 者 有 着 区 别 和 联系 。 


为 了 解释 iterable (可 壕 代 的 ) ， 又 引入 了 一 个 词 “ 迭 代 ”， 什 么 是 迭 
代 呢 ? 


管 我 们 很 多 文档 是 用 英文 号 的 ， 但 是 ， 如 果 你 能 充分 利用 汉 ? J 
理解 蓉 此 多 词 ， 将 是 非 第 有 帮助 的 。 因 为 在 汉语 中 ,不 仪 仅 表 首 ， 
能 从 词语 组 合 中 体会 到 该 术语 的 含义 。 比 如 “激光 ”， 这 是 汉语 。 英语 是 
从 “light amplification by stimulated emission of radiation2” 出 来 的 "laser”， 


它 是 一 个 造 出 来 的 词 ， 因 为 此 前 人 们 不 知道 在 那 种 条 件 下 发 出 来 的 是 什 








么 。 但 是 汉语 不 然 ， 反 正 用 一 个 “ 光 ? 束 可 以 概括 了 ， 只 不 过 这 个 “ 光 ? 不 
是 传统 概念 中 的 “ 光 ”， 而 是 由 于 “ 受 激 ” 辐 射 得 到 的 兴 ， 故 名 “激光 ”。 是 
不 是 汉语 很 牛 ? 


“从 ”在 汉语 中 的 意思 是 “屡次 ， 反 复 "”， 如 高 潮 迭 起 。 跟 * 代 ”组 合 就 
可 以 理解 为 “反复 ' 代 ””， 是 不 是 有 点 “ 子 子孙 孙 ” 的 意思 了 ? “结婚 -生子 - 
子 成 长 -结婚 -生子 - 子 成 长 -.………. ”你 是 不 是 也 在 这 个 “迭代 ”的 过 程 中 
呢 ? 


给 个 各 微 严 格 的 定义 ， 来 自 维 基 百 科 : “ 碗 代 是 重复 反馈 过 程 的 活 
动 ， 其 目的 通常 是 为 了 接近 并 到 达 所 需 的 目标 或 结果 。” 


基 些 类 型 的 对 象 是 “可 和 迭代 ”iterable) 的 ， 但 如 何 判 断 一 个 对 象 是 
不 是 可 和 迭代 的 ? 下 面 演示 一 种 方法 〈 事 实 上 还 有 别 的 方式 ) : 








>>> astr = "python" 
>>> hasattr(astr,'__iter_ _') 
False 


这 里 用 内 建 函 数 hasattr0 判 断 一 个 字符 串 是 侣 是 可 迭代 的 ， 返 回 了 
False。 用 同样 的 方式 可 以 判断 : 


>>> alst = [1,2 


>>> hasattr(alst,'__iter_ _') 
True 

>>> hasattr(3, '__ iter ') 
False 





hasattr() 的 判断 本 质 就 是 看 那个 类 型 中 是 否 有 _ iter 函数。 读者 可 
以 用 dir0 找 一 找 ， 在 数字 、 字 符 串 、 列 表 中 谁 有 __iter 函数。 同样 还 可 
找 一 找 dict、tuple 两 种 类 型 对 象 是 否 含有 这 个 方法 。 


以 上 穿插 了 一 个 新 的 概念 “iterable”( 可 迭代 的 ) ， 现 在 回 到 extend 
上 ， 这 个 函数 需要 的 参数 就 是 iterable 类 型 的 对 象 。 


>>> new = [1, 2, 3] 

>>> lst = ['python'，qiwsir '] 
>>> lst.extend(new) 

>>> lst 

['python', 'qiwsir', 1, 2, 3] 
>>> new 

[2% :31] 


通过 extend 函 数 ， 将 [1，2，3] 中 的 每 个 元 素 都 拿 出 来 ， 然 后 塞 到 lst 
里 面 ， 从 而 得 到 一 个 跟 原 来 的 对 象 元 素 不 一 样 的 列表 ， 比 原来 的 多 了 三 
个 元 素 。 上 面 说 得 有 点 吃 嗪 ， 只 不 过 是 为 了 把 过 程 完整 表达 出 来 。 


从 上 面 的 演示 中 可 以 看 出 ，lst 经 过 extend 函 数 操作 之 后 ， 变 成 了 一 
个 貌似 “新 ”的 列表 。 











>>> new = [1,2,3] 
>>> id(new) 
3072383244L 


>>> lst = ['python', 'qiwsir'] 
>>> id(1lst) 
3069501420L 


用 id0 能 够 看 到 两 个 列表 分 别 在 内 存 中 的 “这 ”的 编写 。 


>>> lst.extend(new) 

>>> lst 

['python', 'qiwsir', 1, 2, 3] 
>>> id(lst) 

3069501420L 


虽然 lst 经 过 extend0) 方 法 之 后 比 原 来 扩容 了 ， 但 是 ， 并 没有 离开 原 
来 的 “ 祖 ?”， 即 在 内 存 中 还 是 “< 旧 ”的 ， 只 不 过 里 面 的 内 容 增多 了 。 相 当 于 
两 口 之 家 ， 经 过 一 看 云雨 之 后 ， 义 增加 了 一 个 小 宝 宇 ， 那 么 这 个 家 
是 “新 ”的 还 是 “ 旧 ” 的 呢 ? 和 角度 不 同 或 许 说 法 不 一 。 


这 就 是 列表 的 一 个 重要 特征 : 列表 是 可 以 修改 的 。 这 种 修改 ， 不 是 
复制 一 个 新 的 ， 而 是 在 原 地 进行 修改 。 


其 实 ，append0 对 列表 的 操作 也 是 如 此 ， 不 妨 用 同样 的 方式 看 看 。 


说 明 : 虽然 这 里 的 lst 内 容 和 上 面 的 一 样 ， 但 是 ， 重 新 在 shell 中 输入 
id 会 变化 。 也 就 是 内 存 分 配 的 “ 视 ” 的 编号 变 了 。 














>>> lst = ['python','qiwsir'] 
>>> id(1lst) 

3069501388L 

>>> lst.append(new) 

>>> lst 

['python', 'gqiwsir', [1, 2, 3]] 
>>> id(1lst) 

3069501388L 


显然 ，append() 也 是 原 地 修改 列表 。 
如 果 对 于 extend0O 提 供 的 不 是 iterable 类 型 对 象 ， 会 如 何 呢 ? 


>>> lst.extend("itdiffer") 
>>> lst 
['python', 'qiwsir', 是 Tt 'd', 由 wh “2 'e', 'r"] 


它 把 一 个 字符 趾 "itdiffer" 转 化 为 [， 中 ， 人 二， 定 ， 侍 ， 和 全， ， 和 多 
局 将 这 个 列表 作为 参数 ， 提 供给 edend 时 将 列表 中 的 元 素 守 入 原来 的 
列表 中 。 


>>> num_lst = [1,2,3] 
>>> num_ Jst.extend(8) 
Traceback (most recent call last): 
File "<stdin>", line 1, in <module> 
TypeError: 'int' object is not iterable 





这 惑 报错 了 。 错 误 提 示 告 诉 我 们 ， 那 个 数字 8 是 int 类 型 的 对 象 ， 不 
是 iterable 的 。 


这 里 讲述 两 个 让 列表 扩容 的 函数 append0 和 extend0， 总 结 其 共同 


. 
dye 


。 都 是 原 地 修改 列表 。 
。 既然 是 原 地 修改 ， 惑 不 返回 值 。 


原 地 修改 没有 返回 值 ， 就 不 能 赋值 给 某 个 变量 。 
>>> one = ["good", "good", "study"] 
>>> another = one.extend(["day", "day","up"]) # 没 有 返回 值 


>>> another # 这 样 的 ， 什 么 也 没有 得 到 。 


>>> one 
['good', 'good', 'study', 'day', 'day', 'up'] 





那么 两 者 有 什么 不 一 样 呢 ? 再 看 下 面 的 例子 之 前 ， 读 者 能 不 能 通过 
前 面 的 操作 总 结 一 下 ? 请 敲 代码 尝试 ， 然 后 看 下 面 的 例子 : 


>>> lst = [1,2,3] 


>>> 


append 是 整 建制 地 妃 加 ，extend 是 个 体 化 扩编 。 


lst.append(["qiwsir","github"]) 


lst 


2, 3, ['qdqiwsir', 'github']] 


len(lst) 


lst2 = [1,2,3] 
lst2.extend(["qiwsir","github"]) 
lst2 


2, 


3, 'qiwsir' 


len(l1st2) 


2.count 


count 的 作用 是 数 一 数 某 个 元 系 在 该 list 中 出 现 多 少 次 ， 


了 


'github'] 


#append 的 结果 


#extend 的 结果 





元 素 有 多 少 个 。 官 方 文 档 是 这 么 说 的 : 


list.count(x) 
Return the number of times x appears in the list. 


一 定 要 不 断 实验 才能 理解 文档 中 精炼 的 表达 。 


la 


la. 


la. 
la. 


la 
2, 


la. 


la. 


= [1, 2, 1, 1, 3] 


count(1) 


append('a') 
append('a') 


1, 1, 3, 'a', 


count('a') 


count(5) 




















5， 但 是 不 报错 ， 返 回 的 





是 


'a'] 


#1la 中 没有 


也 就 是 菜 个 


3.index 


前 面 已 经 讲 过 ， 不 装 述 ， 但 是 为 了 完整 ， 也 占 个 位 置 吧 。 


>>> la 

[1, 2, 3, 'a', 'b', 'c', 'gdiwsir', 'python'] 
>>> la.index(3) 

2 

>>> la.index('gi') # 如 果 不 存在 ， 就 报错 


Traceback (most recent call last): 
File "<stdin>", line 1, in <module> 
ValueError: 'gqi' is not in Jl]ist 


依然 是 上 一 条 官方 解释 ， 主 要 目的 是 熟悉 看 文档 : 


list.index(x) 
Return the index in the list of the first item whose value is x. It is an error if 








古 不 是 说 得 非 第 清楚 明白 了 ? 如 果 没 有 摘 清 楚 ， 赶 快 学 英语 吧 。 未 
来 ， 如 果 在 写 代 码 这 个 职业 上 发 展 ， 英 语 是 绕 不 开 的 。 





4.insert 


除了 向 列表 中 奶 加 元 系 ， 在 现实 中 ， 还 应 该 有 “搬入 ”。Python 提 供 
了 这 样 的 操作 ，list.insert (i，x) 就 是 向 列表 插入 元 素 的 函数 。 


如 果 学 会 了 看 官方 文档 ， 则 学 习 任 何 语言 都 是 小 菜 一 碟 了 。 继 续 看 
Python 官方 文档 是 如 何 解释 insert(O) 的 : 











list.insert(i, x) 
Insert an item at a given position. The first argument is the index of the element 


根据 官方 文档 的 说 明 ， 我 们 做 下 面 的 实验 ， 请 读者 从 实验 中 理解 : 


>>> all_users 
['qiwsir', 'github', 'io'] 
>>> all users.insert("python") 
Traceback (most recent call last): 
File "<stdin>", line 1, in <module> 
TypeError: insert() takes exactly 2 arguments (1 given) 


请 注意 看 报错 的 提示 信息 ，insert0 应 该 供给 两 个 参数 ， 但 是 这 里 只 
给 了 一 个 ， 所 以 报错 没商量 啦 。 





>>> all_users.insert(0, "python") 
>>> all_users 

['python', ‘qiwsir', 'github', 'io'] 
>>> all users.insert(1, "http://") 


>>> all_users 
['python', 'http://', 'qiwsir', 'github', 'io'] 


list.insert (i，x》 中 的 i 是 将 元 素 x 插 入 到 列表 中 的 位 置 ， 即 将 x 插入 
到 索引 值 是 i 的 元 素 前 面 。 注 意 ， 索 引 是 从 0 开始 的 。 


有 一 种 操作 挺 有 意思 的 ， 如 下 : 





>>> length = len(al]l_users) 

>>> length 

5 

>>> all_users.insert(length, "algorithm") 

>>> all_users 

['python', 'http://', ‘qiwsir', 'github', 'io', 'algorithm'] 








在 原来 的 all _users 中 ， 最 大 索引 值 是 4， 如 果 要 
all_users.insert (5，"algorithm") ， 则 表示 将 "algorithm" 插 入 到 索引 值 是 
5 的 前 面 ， 但 是 没有 。 换 个 说 法 ，5 前 面 束 是 4 的 后 面 。 所 以 ， 束 是 奶 加 
J 


其 实 ， 还 可 以 这 样 : 


>>> a = [1,2,3] 

>>> a.insert(9, 777) 
>>> a 

[1, 2, 3, 777] 





也 就 是 说 ， 如 果 遇 到 那个 i 已 经 超过 了 最 大 索引 值 ， 会 自动 将 所 要 
插入 的 元 素 放 到 列表 的 尾部 ， 即 退 加 。 
5.pop 和 remove 


对 列表 ， 不 仅 能 增加 元 素 ， 还 能 被 删除 之 。 删 除 元 素 的 方法 有 两 


个 ， 它 们 分 别 是 : 


e list.remove (Xx) 


Remove the first item from the list whose value is X.It js an error if there 
is no such item. 


e list.pop ([i]) 


Remove the item at the given position in the list, and return it.If no 
index is specified, a.popOQremoves and returns the last item in the list. (The 
square brackets around the i in the method signature denote that the 
parameter is optional, not that you should type square brackets at that 
position.You will see this notation frequently in the Python Library 
Reference.) 


我 学 习 Python 有 一 个 习惯 ,， 束 是 用 学 习 物 理 的 方法 来 学 习 。 不 知道 
读者 的 物理 学 得 怎么 样 ? 如 果 当 初 疫 有 学 好 也 不 用 担心 ， 跟 着 我 的 思路 
走 ， 不 仅 能 学 好 Python， 还 能 学 好 物理 。 物 理 中 有 一 个 非常 重要 的 研 守 
和 学 习 方 法 : 先 实 验 ， 然 后 总 结 规律 。 


对 于 这 种 方法 ， 读 者 回味 一 下 前 面 的 内 容 ， 是 不 是 隐隐 然 有 所 感 
呢 ? 





[过 
关 


先 实 验 listremove (x) ， 这 是 一 个 能 够 删除 list 元 素 的 方法 ， 同 时 上 
面 引 用 的 官方 说 明 告诉 我 们 ， 如 果 Xx 没 有 在 list 中 ， 融 会 报错 。 


>>> all_users 

['python', 'http://', ‘qiwsir', 'github', 'io', "' algorithm '] 
>>> all_users.remove("http://") 

>>> all_users 

['python', ‘qiwsir', 'github', 'io', 'algorithm'] 


>>> all_ users.remove("tianchao") 
Traceback (most recent call last): 

File "<stdin>", line 1, in <module> 
ValueError: list,.remove(x): x not in list 


>>> lst 二 ["python", "java", "python", “GC |] 
>>> lst.remove("python") 

>>> lst 

['java', 'python', 'c'] 





在 第 三 段 实 验 中 ， 列 表 内 有 两 个 python' 子 符 串 ， 当 删除 后 ， 友 现 结 
果 只 删除 了 第 一 个 'python' 字 符 串 ， 第 二 个 还 在 。 原 因 何 在 ? 请 仔细 看 前 


面 的 文档 说 明 : remove the first item...。 
注意 : 


。 如 果 正 确 删 除 ， 不 会 有 任何 反馈 。 没 有 消息 就 是 好 消息 ， 因 为 是 对 
列表 进行 原 地 修改 。 
。 如 果 所 删除 的 对 象 不 在 list 中 ， 束 报错 。 注 意 阅 读 报 错 信息 : x not 


in list。 


读者 在 阅读 的 时 候 如 果 没 有 关注 某 些 细节 ， 往 往 就 失去 了 本 书 的 某 
些 精华 ， 比 如 我 在 前 面 的 很 多 操作 中 ， 都 使 用 了 一 个 名 为 lst 的 变量 ， 而 
不 是 用 list， 为 什么 呢 ? 因为 list 是 Python 的 保留 字 。 


什么 是 保留 字 ? 在 Python 中 ， 某 些 词 语 或 者 拼写 是 不 能 被 用 户 拿 来 
做 变量 、 函 数 、 类 等 命名 ， 因 为 它们 已 经 被 语言 本 号 先 占用 了 。 这 些 就 
人 





and, assert, break, class, continue, def, del, elif, else, 
except, exec, finally, for, from, global, if, import, in, is, 
lambda, not, or, pass, print, raise, return, try, while, with, yield 


这 些 保留 字 都 是 我 们 在 编程 中 要 用 到 的 ， 有 的 你 已 经 在 前 面 轴 到 
Ts 


如 采 能 够 在 执行 删除 之 前 ， 驳 判断 列表 中 是 否 有 那个 对 象 ， 有 了 再 
删 ， 没 有 就 别 费 事 了 ， 是 不 是 更 显 出 程序 的 智能 程度 高 呢 ? 


这 的 确 是 一 个 不 错 的 想法 。 你 觉得 应 该 如 何 实现 ? 











>>> all_users 
['python', 'gqiwsir', 'github', 'io', 'algorithm'] 
>>> "python" in all users # 用 




















in 来 判断 是 否 在 





list 中 


True 


>>> if "python" in all users: 
all_users.remove("python") 
ep print all users 
, else: 
print "'python' is not in all users" 


['qiwsir', 'github', 'io', 'algorithm'] # 删除 了 


"python" 元 素 


>>> if "python" in all users: 
l all_users.remove("python") 
es print all users 
, else: 
print "'python' is not in all users" 





"python' is not in all users # 基 








过 


己 经 删除 了 ， 所 以 就 没有 了 。 








上 述 代码 ， 就 是 两 段 小 程序 ， 我 是 在 交互 模式 中 运行 的 ， 相 当 于 小 
讲 到 的 东西 ，if-else 语 句 。 不 过 ， 我 
党 得 即使 没有 学 习 ， 你 也 能 看 全 ， 因 为 它 非常 接近 目 然 语言 了 。 


精力 旺盛 的 读者 还 可 以 将 上 面 的 问题 编写 成 一 段 小 程序 单独 运行 。 


接着 看 另外 一 个 删除 lispop“〈 趾 ) 的 程序 。 方 法 还 是 : 看 看 文档 ， 
做 做 实验 。 





>>> all users 
['qiwsir', 'github', 'io', 'algorithm'] 
>>> all users.pop() #1ist .pop( [i] ), 圆 括号 里 面 是 




















[i]， 表 示 这 个 序号 是 可 选 的 








'algorithm' # 默 认 删 除 最 后 一 个 ， 并 且 将 该 结果 返回 

















>>> all_users 
['qiwsir', 'github', 'io'] 


>>> all_users.pop(1) # 指 定 删除 编号 为 


1 的 元 素 
"github" 
'github' 


>>> all_users 
['qiwsir', 'io'] 








>>> all_users.pop() 

1'io!' 

>>> all users # 只 有 一 个 元 素 了 ， 该 元 素 编 号 是 
0 

['qiwsir'] 

>>> all_users.pop(1) # 但 是 非 要 删除 编号 为 





1 的 元 素 ， 结 果 报 错 。 


Traceback (most recent call last): 
File "<stdin>", line 1, in <module> 
IndexError: pop index out of range 





list.remove (x)〉 中 的 参数 是 列表 中 元 素 ， 即 删除 某 个 元 素 ; 
list.pop〈[ 记 〉 中 的 i 是 列表 中 元 素 的 索引 值 ， 这 个 i 用 方 括 号 包 里 起 来 ， 
ee 如 上 面 的 操作 结果 ， 束 是 删除 列表 的 最 
品 |。 


留 一 个 思考 题 ， 如 果 要 像 前 面 那 样 ， 能 不 能 事先 判断 一 下 要 删除 的 
编号 是 不 是 在 list 的 长 度 范围 (用 len (list〉 获取 长 度 ) 以 内 ， 然 后 进行 
删除 或 者 不 删除 操作 ? 

















6.reverse 


reverse 比 较 简 单 ， 就 是 把 列表 的 元 素 顺 序 反 过 来 。 





>>> a = [3,5,1,6] 
>>> areverse( ) 
>>> a 

[6, 1, 5, 3] 








注意 ， 是 原 地 反 过 来 ， 不 是 另外 生成 一 个 新 的 列表 ， 所 以 ， 它 没有 
返回 值 。 跟 这 个 类 似 的 有 一 个 内 建 图 数 reversed， 建 议 读 者 了 解 一 下 这 
个 函数 的 使 用 方法 。 


因为 list,reverse0 不 返回 值 ， 所 以 不 能 实现 对 列表 的 反 辐 迭代， 如 果 
要 这 么 做 ， 可 以 使 用 reversed 函 数 。 


7.sort 


sort 是 对 列表 进行 排序 。 文 档 中 是 这 么 写 的 : 








sort(...) 
L.sort(cmp=None, key=None, reverse=False) -- stable sort IN PLACE; cmp(x, y) -> -1, 


>>> a = [6, 1, 5, 3] 
>>> a.sort() 


list.sort() 也 是 让 列表 进行 原 地 修改 ， 没 有 返回 值 。 默 认 情 况 如 上 面 
的 操作 ， 实 现 的 是 从 小 到 大 的 排序 。 


>>> a.sort(reverse=True) 
>>> a 
[6, 5, 3, 1] 


这 样 ， 实 现 了 从 大 到 小 的 排序 。 

在 前 面 的 函数 说 明 中 ， 还 有 一 个 参数 key， 这 个 怎么 用 呢 ? 不 知道 
你 是 人 否 熟悉 电子 表格 ， 能 够 设置 按照 某 个 关键 字 进 行 排序 。Python 当然 
不 会 比 电子 表格 弱 。 


>>> lst = ["python","java","c","pascal","basic"] 
>>> lst.sort(key=len) 

>>> lst 

['c', 'java', 'basic', 'python', 'pascal'] 


这 是 以 字符 串 的 长 度 为 关键 词 进 行 排序 的 。 


对 于 排序 ， 还 有 一 个 更 为 常用 的 内 建 函 数 sorted， 读 者 可 以 去 人 研究 
一 秋 ， 并 且 比 较 一 下 两 种 排序 的 各 自 特点 。 


顺便 指出 ， 排 友 是 一 个 非常 有 研究 价值 的 话题 ， 不 仅仅 是 这 一 个 函 
数 。 有 兴趣 的 读者 可 以 去 网 上 搜 一 下 与 排序 相关 的 知识 。 





1.8 比较 列表 和 字符 串 


列表 和 字符 串 两 种 对 象 类 型 有 不 少 相 似 的 地 方 ， 也 有 很 大 的 区 别 。 
有 必要 对 它们 做 个 简要 的 比较 ， 以 便 能 深刻 理解 ， 此 外 也 是 复习 ，“ 温 
故而 知 新 ”。 


1.8.1 相同 点 


两 者 都 属于 序列 类 型 ， 由 此 ， 那 些 属于 序列 的 操作 对 两 者 都 适用 。 


在 对 序列 类 型 理解 的 基础 上 ， 用 趋 于 专业 的 语言 描述 : 它 的 每 一 个 
元 素 都 可 以 通过 指定 一 个 编号 《〈 行 话 叫 做 “ 俩 移 量 ?或 者 “索引 值 ?) 的 方 
式 得 到 ， 而 要 想 一 次 得 到 多 个 元 系 ， 可 以 使 用 切片 。 偶 移 量 或 者 索引 值 
从 0 开始 ， 到 总 元 素数 减 1 结 














>>> welcome_str = "Welcome you" 

>>> welcome_str[0] 

Ww! 

>>> welcome_str[len(welcome_str) - 1] 
1U7 

>>> welcome_str[:4] 

"Welc 

>>> a = "python" 

>>> a*3 

'pythonpythonpython'’ 


>>> git_list = ["qiwsir","github","io"] 

>>> git_1list[0] 

'qiwsir' 

>>> git_list[len(git_ list) - 1] 

1'i0' 

>>> git_list[0:2] 

['qiwsir', 'github'] 

>>> b = ['qiwsir'] 

>>> b * 7 

['qiwsir', 'qiwsir', 'qiwsir', 'qiwsir', 'giwsir', 'qiwsir', 'qgiwsir'] 


还 有 一 些 操 作 是 类 似 的 : 


>>> first = "hello,world" 
>>> welcome_str 

'Welcome you' 

>>> first+","+welcome_str 
'hello,world,Welcome you' 


>>> language = ['python'] 

>>> git_list 

['qiwsir', 'github', 'io'] 

>>> language + git_list 

['python', 'qiwsir', 'github', 'io'] 
>>> len(welcome_str) 

11 


>>> len(git_list) 
3 


其 他 关于 序列 的 基本 操作 ， 此 处 不 再 重复 。 


1.8.2 区别 





列表 和 字符 串 的 最 大 区 别 是 : 列表 是 可 以 改变 ， 字 符 串 不 可 变 。 
首先 看 对 列表 的 这 些 操作 ， 其 特点 是 在 原 处 将 列表 进行 了 修改 : 





>>> git_list 
['qiwsir', 'github', 'io'] 


>>> git_list,.append("python") 
>>> git_list 
['qiwsir', 'github', 'io', 'python'] 


>>> git_1list[1] 

'github' 

>>> git_1list[1] = 'github.com' 

>>> git_list 

['qiwsir', 'github.com', 'io', 'python'] 


>>> git_list.insert(1, "algorithm") 
>>> git_list 
['qiwsir', 'algorithm', 'github.com', 'io', 'python'] 


>>> git_list.pop() 
'python' 


>>> del git_list[1] 


>>> git_list 
['qiwsir', 'github.com', 'io'] 


以 上 这 些 操作 ， 如 果 用 在 str 上 都 会 报错 ， 比 如 : 


>>> welcome_str 
'Welcome you' 


>>> welcome_str[1]="'E' 

Traceback (most recent call last): 

File "<stdin>", line 1, in <module> 

TypeError: "Str' object does not support item assignment 


>>> del welcome_str[1] 

Traceback (most recent call last): 

File "<stdin>", line 1, in <module> 

TypeError: 'str' object doesn't support item deletion 


>>> welcome_str.append("E") 

Traceback (most recent call last): 

File "<stdin>", line 1, in <module> 

AttributeError: 'str' object has no attribute 'append ' 


如 果 要 修改 一 个 str， 不 得 不 这 样 。 


>>> welcome_str 
'Welcome you' 














>>> welcome_str[0]+"E"+welcome_ str[2:] # 重 新 生成 一 个 
str 

'WElcome you' 

>>> welcome_str # 对 原来 的 没有 任何 影响 





'Welcome you' 


其 实 ， 在 这 种 做 法 中 束 是 重新 生成 了 一 个 str。 


1.8.3 多维 列表 





在 字符 串 中 ， 每 个 元 素 只 能 是 字符 ， 在 列表 中 ， 元 素 可 以 是 任何 类 
型 。 前 面 见 到 的 大 多 是 数 : 子 或 者 : 子 符 ， 其 实 还 可 以 这 样 : 











>>> matrix = [[1,2,3],[4,5,6],[7,8,9]] 
>>> matrix = [[1,2,3],[4,5,6],[7,8,9]] 
>>> matrix[0][1] 

2 

>>> mult = [[1,2,3],['a','b','c'],'d','e'] 
>>> mult 

[[1, 2, 3], ['a', 'b', 'c'], 'd', 'e'] 
>>> mult[1][1] 

pb" 

>>> mult[2] 


ee 
以 上 显示 了 多 维 列表 以 及 访问 方式 。 在 多 维 的 情况 下 ， 里 面 的 列表 

被 当成 一 个 元 际 对 待 。 

1.8.4 列表 和 字符 串 的 互相 转化 


以 下 涉及 split0 和 join0 两 个 函数 ， 在 前 面子 得 串 部 分 已 经 见 过 。 一 
J 特别 是 在 已 经 学 习 了 列表 的 基础 上 见面 ， 应 该 有 更 深刻 
理解 。 





str.split() 
这 个 内 置 函数 实现 的 是 将 str 转 化 为 list。 其 中 str="" 是 分 隔 符 。 
请 先 在 交互 模式 下 做 如 下 操作 : 


>>>help(str.split) 


得 到 了 对 这 个 内 置 函数 的 完整 说 明 。 特 别 强调 这 是 一 种 非常 好 的 
和 些 方法 ， 所 谓 “ 授 人 以 鱼 不 如 授 
以 渔 ”) 


split (...) S.split ([sep[, maxsplit]]) ->list of strings 


Return a list of the words in the string S, using sep as the delimiter 
string.If maxsplit is given, at most maxsplit splits are done.If sep is not 
specified or is None, any whitespace string is a separator and empty strings 
are removed from the result. 


不 管 是 否 看 懂 上 和 面 这 段 话 ， 部 来 看 一 下 例子 。 





>>> line = "Hello.I am qiwsir.Welcome you. 
>>> line.split(".") #L 欧文 的 向 点 为 分 隔 符 


品 ， 





['Hello', 'I am qiwsir', 'Welcome you', ''] 


# 这 个 





1, 就 是 表达 了 官方 文档 中 的 : 





If maxsplit is given, at most maxsplit splits are done. 
>>> line.split(".",1) 
['Hello', 'I am qiwsir.Welcome you.'] 











>>> name = "Albert Ainstain" # 也 有 可 能 





空格 作为 分 隔 符 














>>> name.split(" ") 
['Albert', 'Ainstain'] 


下 面 的 例子 ， 让 你 更 有 点 惊奇 了 。 


>>> s = "I am, writing\npython\tbook on line" 








# 这 个 字符 串 中 有 空格 、 豆 号、 换行 














\n、 











tab 缩 进 





AI 


Nt 从 与 


>>> print s 

I am, writing 

python book on line 

>>> s.split() # 











入 








split(), 但 是 括号 中 不 输入 任何 参数 


['I', 'am,', 'writing', 'python', 'book', 'on', 'line'] 


如 果 split0 不 输入 任何 参数 ， 显 示 就 是 见 到 任何 分 割 符号 ， 就 用 其 
分 割 了 。 


1.8.5 "[sep]".join (list) 


join 可 以 说 是 split 的 逆 运 算 ， 举 例 : 


>>> name 


[' Albert '， 'Ainstain'] 
>>> "",. join(name ) 
'AlbertAinstain' 

>>> ".".join(name) 
"Albert .Ainstain' 

>>> " ".join(name) 
'Albert Ainstain' 


回 到 上 面 那 个 神奇 的 例子 中 ， 可 以 这 样 使 用 join.: 


>>> s = "I am writingxnpythonxtbook on line" 
>>> print s 

I am, writing 

python book on line 

>>> s.split() 

['I', 'am,', 'writing', 'python', 
>>> " ".join(s.split()) # 


book', 'on', 'line'] 
新 连接 ， 不 过 有 一 点 遗憾， 








HI 愉 = 














am 后 面 逗 号 还 是 有 的 。 











# 怎 么 去 掉 ? 


'I am writing python book on line' 


1.9 元 组 


1.9.1 定义 


先 看 一 个 例子 : 


>>> # 变 量 引 

















用 











str 

>>> S 二 DC 
>>> S 

"abc' 


>>># 如 果 这 样 写 ， 就 会 是 





>>> t = 123，'abc'，[ “come" "here"] 
>>> t 
(123, 'abc', ['come', 'here']) 


上 面 例 子 中 并 没有 报错 ， 也 没有 “最 后 一 个 有 效 ”， 而 是 将 对 象 作为 
一 个 新 类 型 : tuple《〈 元 组 ) ， 赋 值 给 了 变量 t。 


元 组 是 用 圆 括号 括 起 来 的 ， 元 又 之 间 用 逗号 阳 开 。【〔 特 别提 醒 ， 不 
管 是 圆 括号 还 是 逗号 ， 都 是 英文 半角 的 。 这 个 并 非 杞 人 忧 天 ， 不 知道 什 
么 原因 ， 人 己 的 电脑 默认 输入 方式 为 中 文 ， 结 
果 币 着 在 代码 中 插入 全 角 符 号 。 


元 系 中 的 元 素 可 以 是 任何 Python 对 象 类 型 。 


其 实 ， 你 不 应 该 对 元 组 陌生 ， 前 面 讲 述 字符 串 的 格式 化 输出 时 ， 有 
这 样 一 种 方式 : 

















>>> print "I love %s, and I am a %s" % ('python', "programmer ' ) 
I love python, and I am a programmer 


这 里 的 圆 括号 就 是 一 个 元 组 。 


元 组 也 是 一 种 序列 ， 这 一 点 与 列表 、 字 符 串 类 似 。 它 的 特点 就 是 其 
中 的 元 素 不 能 更 改 ， 这 一 点 与 列表 不 同 ， 倒 是 跟 字 符 串 类 似 ; 它 的 元 勾 
又 可 以 是 任何 类 型 的 数据 ， 这 一 点 与 列表 相同 ， 但 不 同 于 字符 串 。 





>>> t = 1,"23",[123,"abc"], ("python", "learn") # 元 素 多 样 性 ， 近 





list 
>>> 七 
(1, '23', [123, 'abc'], ('python', 'learn')) 


>>> t[0] = 8 


# 不 能 原 地 修改 ， 近 


str 
Traceback (most recent call last): 
File "<stdin>", line 1, in <module> 
TypeError: 'tuple' object does not support item assignment 


>>> t.append("no") 
Traceback (most recent call last): 
File "<stdin>", line 1, in <module> 
AttributeError: 'tuple' object has no attribute 'append' 





从 上 面 的 简单 比较 似乎 可 以 认为 ， 元 组 惑 是 一 个 融合 了 部 分 列表 和 
部 分 字符 串 属性 的 杂交 产物 。 


1.9.2 ”索引 和 切片 





前 面 有 了 关于 列表 和 字符 串 的 知识 基础 ， 它 们 都 是 序列 类 型 ， 元 组 
也 是 。 因 此， 元 组 的 基本 操作 和 它们 是 一 样 的 。 


例如 : 


>>> t 

(1, '23', [123, 'abc'], ('python', 'learn')) 
>>> t[2] 

[123, 'abc'] 

>>> t[1:] 


('23', [123, 'abc'], ('python', 'learn')) 


>>> t[2] [90] # 还 能 这 样 呀 ， 哦 ， 对 了 ， 





list 中 也 能 这 样 





123 
>>> t[3][1] 
'learn' 


. 关于 序列 的 基本 操作 在 元 组 上 的 表现 束 不 一 一 展示 了 ， 读 者 自行 调 
试 吧 。 





但 是 这 里 要 特别 提醒 ， 如 果 一 个 元 组 中 只 有 一 个 元 素 ， 应 该 在 该 元 
素 后 面 加 一 个 半角 的 英文 逗号 。 


>>> a = (3) 
>>> type(a) 
<type 'int'> 


>>> b = (3,) 
>>> type(b) 
<type 'tuple'> 





如 果 不 加 那个 喜 号 就 不 是 元 组 ， 加 了 才 是 ， 这 也 是 为 了 避免 让 
Python 误解 你 要 表达 的 内 容 。 


列表 和 元 组 之 间 可 以 实现 转化 ， 分 别 使 用 list0 和 tupleO 实 现 。 


>>> t 

(1, '23', [123, 'abc'], ('python', 'learn')) 

>>> tls = list(t) #tuple-->list 
>>> tls 


[1, '23', [123, 'abc'], ('python', 'learn')] 
>>> t_tuple = tuple(t1ls) #1list-->tuple 


>>> t_tuple 
(1, '23', [123, 'abc'], ('python', 'learn')) 


1.9.3 用途 
既然 元 组 是 列表 和 字符 串 的 杂 合 ， 那 么 它 有 什么 用 途 呢 ? 不 是 用 列 
表 和 字符 串 就 可 以 了 吗 ? 


有 些 情况 只 需要 列表 和 字符 串 ， 但 是 ， 世 界 是 复杂 的 ， 我 们 要 解决 
的 问题 不 全 是 简单 问题 ， 就 如 同 目 然 语言 一 样 ， 虽 然 有 的 词汇 看 似 可 有 











可 无 ， 用 别 的 也 能 丛 换 之 ， 但 我 们 依然 要 在 某 些 情况 下 使 用 它们 。 
一 般 认 为 元 组 有 这 些 特点 ， 并 且 也 是 它 使 用 的 情景: 


元 组 比 列表 操作 速度 快 。 如 果 定 义 了 一 个 值 的 稼 量 集 ， 并 且 唯 一 要 
用 所 做 的 是 不 断 地 遇 历 〈 通 历 是 一 种 操作 ， 读 者 可 以 看 后 面 的 for 循 
环 ) 它 ， 请 使 用 元 组 代替 列表 。 

如 琳 对 不 需要 修改 的 数据 进行 “ 写 保护 ”， 可 以 使 代码 更 安全 ， 这 时 
使 用 元 组 而 不 是 列表 。 如 果 必 须要 改变 这 些 值 ， 则 需要 执行 元 组 到 
列表 的 转换 。 

元 组 可 以 在 字典 ( 态 外 一 种 对 象 类 型 ， 请 参考 后 面 的 内 容 〉 中 被 用 
作 key， 但 是 列表 不 行 。 因 为 字典 的 key 必 须 是 不 可 变 的 ， 元 组 本 号 
是 不 可 改变 的 。 

。 元 组 可 以 用 在 字符 串 格 式 化 中 。 











1.:10， 学 上 典 


你 现在 还 用 字典 吗 ? 随 着 网 络 的 发 展 ， 用 字典 的 人 越 来 越 少 了 ， 不 
Ee A A 
典 》。 


《新 华 字 典 》 是 中 国 第 一 部 现代 汉语 字典 ， 最 早 的 名 字 叫 《 伍 记 小 
字典 》， 但 未 能 编纂 完成 。 自 1953 年 ， 开 始 重 编 ， 其 凡 例 完全 采用 《 伍 
记 小 字典 》。 从 1953 年 开始 出 版 ， 经 过 反复 修订 ， 但 是 以 1957 年 商务 印 
书馆 出 版 的 《新 华 字 典 》 作 为 第 一 版 。 由 原 新 华 辞 书社 编写 ，1956 年 并 
入 中 科 院 语言 研究 所 《〈 现 中 国 社 科 院 语言 研究 所 ) 词典 编辑 室 ， 新 华 字 
典 由 商务 印 书馆 出 版 。 历 经 几 代 上 百名 专家 学 者 10 余 次 大 规模 修订 ， 重 
印 200 多 次 。 成 为 迄今 为 止 世 界 出 版 史上 发 行 量 最 高 的 字典 。 


在 这 里 讲 到 字典 ， 不 是 为 了 回忆 ， 而 是 提醒 读者 想 想 我 们 如 何 使 用 
字典 : 先 碍 索引 ， 然 后 通过 索引 找到 相应 内 容 ， 不 用 从 头 开始 一 页 一 页 
地 找 ， 这 种 方法 能 够 快捷 地 直达 目标 。 


正 是 基于 这 种 需要 ，Python 中 有 了 一 种 叫 作 dictionary 的 对 象 类 型 ， 
翻译 过 来 就 是 “字典 ?”， 用 dict 表 示 。 


假设 有 一 种 需要 ， 要 存储 城市 和 电话 区 号 ， 苏 州 的 区 号 是 0512， 唐 
山 的 是 0315， 北 京 的 是 011， 上 海 的 是 012。 用 前 面 已 经 学 习 过 的 知识 ， 
可 以 这 样 来 做 : 

















>>> citys = ["suzhou", "tangshan", "beijing", "shanghai"] 
>>> city_codes = ["0512", "0315", "011", "012"] 





用 一 个 列表 来 存储 城市 名 称 ， 然 后 用 另外 一 个 列表 一 一 对 应 地 保存 
区 号 。 假 如 要 输出 苏州 的 区 号 ， 可 以 这 样 做 : 


>>> print 


"{0} : {1}".format(citys[0], city_codes[0]) 
suzhou : 0512 








在 city_codes 中 表示 区 号 的 元 素 没 有 用 整数 型 ， 而 是 使 用 了 字符 串 


类 型 ， 你 知道 为 什么 吗 ? 如 果 用 整数 ， 就 是 这 样 的 : 


>>> suzhou_code = 0512 
>>> print suzhou_code 
330 


怎么 会 这 样 ? 原来 ， 在 Python 中 如 果 按 照 上 面 那样 做 ，0512 被 认为 
是 一 个 八进制 的 数 ， 用 print 打 印 的 时 候 ， 将 它 转换 为 了 十 进 制 输出 。 关 
于 进 制 转换 问题 ， 可 以 在 网 上 搜索 一 下 有 关 资 料 ， 此 处 不 详 述 。 一 般 是 
用 几 个 内 建 函数 实现 : int0，bin0，octO0，hex0)。 


用 两 个 列表 分 别 来 存储 城市 和 区 号 ， 似 乎 能 够 解决 问题 。 但 是 ， 这 
不 是 最 好 的 选择 ， 因 为 Python 还 提供 了 妃 外 一 种 方案 ， 那 就 是 “字典 ”。 


1.10.1 创建 字典 


方法 1: 
创建 一 个 空 的 字典 ， 然 后 可 以 加 入 东西 。 


>>> mydict = {} 
>>> mydict 


0 
不 要 小 看 “ 空 ”， 在 编程 中 ,“ 空 ”是 很 重要 。 


当然 可 以 创建 一 个 不 空 的 字典 : 


>>> person = {"name":"qiwsir", "site":"qiwsir.github.io", "language":"python"} 
>>> person 
{'name': 'qiwsir', 'language': 'python', 'site': 'giwsir.github.io'} 


"name":"giwsir" 有 一 个 优雅 的 名 字 : 键 值 对 。 前 面 的 name 叫 做 键 
(key) ， 后 面 的 qiwsir 是 前 面 的 键 所 对 应 的 值 (value〉。 在 一 个 字典 
中 ， 键 是 唯一 的 ， 不 能 重复 。 值 则 对 应 于 键 ， 且 值 可 以 重复 。 键 值 之 间 
用 更 文 的 冒号 ， 每 一 对 键 值 之 间 用 瑞 文 的 逗号 隔 开 。 








>>> person['name2']="qiwsir" # 增 加 键 值 对 的 方法 


>>> person 
{'name2': 'dqiwsir'， 'name': 'qiwsir', 'language': 'python', 'site': 'qiwsir.github. 


用 这 样 的 方法 可 以 同一 个 字典 中 增加 “ 键 值 对 ， 那 么 ， 增 加 了 值 之 
后 ， 那 个 字典 对 象 还 是 原来 的 内 存 地 址 吗 ? 即 也 要 探讨 字典 是 否 能 原 地 
修改 ? 《列表 可 以 ， 因 为 列表 是 可 变 的 ; 字符 串 和 元 组 都 不 行 ， 因 为 它 
们 是 不 可 变 的 ) 。 


>>> ad = 人 

>>> id(ad) 

3072770636L 

>>> ad["name"] = "qiwsir" 
>>> ad 

{'name': 'qiwsir'} 

>>> id(ad) 

3072770636L 


实验 表明 ， 字 典 可 以 原 地 修改 ， 即 它 是 可 变 的 。 
方法 2: 
利用 元 组 建构 字典 ， 方 法 如 下 : 


>>> name = (["first", "Google"], ["second", "Yahoo"]) 
>>> website = dict(name) 

>>> website 

{'second': 'Yahoo', 'first': 'Google'} 


或 者 用 这 样 的 方法 : 


>>> ad = dict(name="qiwsir", age=42) 
>>> ad 
{'age': 42, 'name': 'qiwsir'} 


方法 3: 
这 个 方法 ， 跟 以 上 方法 的 不 同 在 于 使 用 fromkeys: 


>>> website = {}.fromkeys(("third","forth"),"facebook") 
>>> website 
{'forth': 'facebook', 'third': 'facebook'} 


特别 注意 ， 字 上 典 中 的 “ 键 ”"， 必须 是 不 可 变 对 象 ;“ 值 ”可 以 是 任意 类 


型 的 对 象 。 


>>> dd = {(1,2):1} 

>>> dd 

{(1, 2): 1} 

>>> dd = {[1,2]:1} 

Traceback (most recent call last): 
File "<stdin>", line 1, in <module> 

TypeError: unhashable type: 'list' 


1.10.2 ”访问 字典 的 值 

字典 类 型 的 对 象 是 以 键 值 对 的 形式 存储 数据 的 ， 所 以 ， 只 要 知道 
键 ， 束 能 得 到 值 ， 这 在 本 质 上 就 是 一 种 映射 关系 。 

映射 ， 束 好比 “物体 "和 “影子 ”的 关系 ,“ 形 影 相 吊 ”， 两 者 之 间 是 映 
射 和 关系 。 此 外 ， 映射 也 是 一 个 严格 的 数学 概念 A 是 非 空 集合 。A 到 B 的 
映射 是 指 : A 中 每 个 元 素 都 对 应 到 B 中 的 某 个 元 素 。 


既然 是 映 冉 ， 就 可 以 通过 字典 的 “ 键 ” 找 到 相应 的 “ 值 ”。 








>>> person 


{'name2': 'giwsir', 'name': 'qiwsir', 'language': 'python', 'site': 'qiwsir.github. 
>>> person['name'] 

'qiwsir' 

>>> person['language'] 

'python' 


“ 刍 " 很 关键 ， 因 为 通过 < 刍 " 能 够 增加 “ 值 ”， 通 过 刍 " 能 够 故 
变 “ 值 *， 通 过 “ 键 * 也 能 够 访问 到 “ 值 ”。 


本 小 节 开 头 的 城市 和 区 号 的 关系 ， 也 可 以 用 字典 来 存储 和 读 取 。 


>>> City_code = {"suzhou":"0512", "tangshan":"0315", "beijing":"011", "shanghai":"0 
>>> print city_code["suzhou"] 


既然 字典 是 键 值 对 的 映射 ， 束 不 用 考虑 所 谓 “ 排 序 ” 问 题 了 ， 只 要 通 
过 键 就 能 找到 值 ， 人 至 于 这 个 键 值 对 的 位 置 在 哪里 就 不 用 考虑 了 。 比 如 ， 
刚才 建立 的 city_code。 





city_code。 


>>> City_code 
{'suzhou': '0512', 'beijing': '011', 'shanghai': '012', 'tangshan': '0315'} 





0 刚刚 赋值 的 时 候 顺 序 有 别 ， 但 是 不 影 啊 读 取 其 中 














在 列表 中 ， 通 过 索引 值 可 以 得 到 茶 个 元 素 。 那 么 在 字典 中 有 索引 
吗 ? 当然 没有 ， 因 为 它 没 有 顺序 ， 又 哪里 来 的 索引 呢 ? 所 以 ， 在 字典 中 
束 不 要 什么 索引 和 切片 了 。 


字典 中 的 这 类 以 “ 键 值 对 ”的 映射 方式 存储 数据 是 一 种 非常 高 效 的 方 
法 ， 比 如 要 读 取 值 的 时 候 ， 如 有 果 用 列表 ，Python 需 要 从 头 开 始 读 ， 直 到 
找到 指定 的 那个 索引 值 。 但 是 ， 在 字典 中 是 通过 “ 键 来 得 到 值 ， 要 高 效 
得 多 。 正 是 这 个 特点，“ 键 值 对 ”这 样 的 形式 可 以 用 来 存储 大 规模 的 数 
据 ， 因 为 检索 快捷 ， 规 模 越 大 越 明 显 。 所 以 ，mongdb 这 种 非 关 系 型 数 
据 库 在 大 数据 方面 比较 流行 。 








1.10.3 ”基本 操作 


列举 字典 的 基本 操作 : 


len Cd) ， 返 回 字 典 〈d) 中 的 键 值 对 的 数量 。 

d[key]， 返 回 字 典 (d) 中 的 键 (key) 的 值 。 

d[key]=value， 将 值 “value) 赋 给 字典 《〈d) 中 的 键 (key) 。 
del d[key]， 删 除 字典 〈d) 的 键 (key) 项 《将 该 键 值 对 删除 ) 。 
key in d， 检 碍 字典 《〈d) 中 是 否 含有 键 为 key 的 项 。 


依次 进行 演示 。 


>>> city_code 

{'suzhou': '0512', 'beijing': '011', 'shanghai': '012', 'tangshan': '0315'} 
>>> len(city_code) 

4 





以 city_code 为 操作 对 象 ，len (city_code) 的 值 是 4， 表 明 有 四 组 键 
值 对 ， 也 可 以 说 是 四 项 。 如 果 增 加 项 目 ， 则 ; 


>>> city_code["nanjing"] = "025" 
>>> city_code 
{' Suzhou ' : '0512', 'beijing': '011', 'shanghai': '012', 'tangshan': '0315', "nanjin 





突然 发 现 北京 的 区 号 写 错 了 。 可 以 这 样 修改 ， 这 进一步 说 明 字 典 是 
可 变 的 。 


>>> city_code["beijing"] = "010" 
>>> city_code 
{'suzhou': '0512', 'beijing': '010', 'shanghai': '012', 'tangshan': '0315', 'nanjin 


不 仅 北 京 的 写 错 了 ， 上 海 的 也 写 错 了 ， 干脆 删除 ， 使 用 del， 将 那 
项 全 部 删 掉 。 





>>> city_code["shanghai"] 

"012 

>>> del city_code["shanghai"] 

>>> city_code["shanghai"] 

Traceback (most recent call last): 
File "<stdin>", line 1, in <module> 

KeyError: 'shanghai' 


"shanghai" 的 那个 键 值 对 项 已 经 删除 了 ， 所 以 不 能 找到 ， 用 in 来 看 
看 ， 返回 的 是 False。 


>>> "shanghai" in city_code 
False 


1.10.4 字符 串 格 式 化 输出 








字符 串 格 式 化 输出 问题 是 前 面 已 经 存在 的 内 容 ， 这 里 再 次 提 到 是 因 
为 用 字典 也 可 以 实现 格式 化 字符 串 的 目的 。 


>>> city_code = {"suzhou":"0512", "tangshan":"0315", "hangzhou":"0571"} 
>>> " Suzhou is a beautiful city, its area code is %(suzhou)s" % city_code 
"Suzhou is a beautiful city, its area code is 0512' 


这 种 写法 非常 简洁 ， 而 且 很 有 意思 ， 有 人 说 它 很 酷 。 
甘 


人 
荆 汰 ， 











在 做 网 页 开发 的 时 候 通 常 要 用 到 模板 ， 你 只 需要 写 好 HTML 代 码 ， 
然后 将 某 些 部 位 空 出 来 ， 等 着 Python 后 台 提 供 相 应 的 数据 即 可 。 当 然 ， 
下 面 所 演示 的 是 玩具 代码 ， 基 本 没有 什么 实用 价值 ， 因 为 在 真实 的 网 站 
开发 中 ， 这 样 的 知识 很 少 用 。 但 是 ， 它 绝 非 花 拳 乡 腿 ， 而 是 你 能 够 明了 
其 本 质 ， 至 少 了 解 到 一 种 格式 化 方法 的 应 用 。 








>>> temp = "<html><head><title>%(1lang)s<title><body><p>My name is %(name)s.</p> 
>>> my = {"name":"qiwsir", "lang":"python"} 
>>> temp % my 

'<html><head><title>python<title><body><p>My name is qiwsir.</p></body></head> 


temp 就 是 所 谓 的 模板 ， 双 引号 所 包 于 的 实质 上 是 一 段 HTML 代 码 。 
OO 
量 。 


是 不 是 一 个 很 有 意思 的 履 龙 之 技 ? 





1.10.5 “相关 概念 





以 下 内 容 是 跟 字 典 有 关联 的 基本 知识 ， 从 维基 百科 上 抄录 下 来 ， 供 
读者 参考 使 用 。 

1. 关 联 数组 

在 计算 机 科学 中 ， 关 联 数 组 (英语 : Associative Array) 又 称 映 射 
(Map) 、 字 典 (Dictionary〉 是 一 个 抽象 的 数据 结构 ， 它 包含 着 类 似 
于 “ 键 值 ?的 有 序 对 。 一 个 关联 数组 中 的 有 序 对 可 以 重复 〈 如 C++ 中 的 
multimap) 也 可 以 不 重复 〈 如 C++ 中 的 map) 。 

这 种 数据 结构 包含 以 下 几 种 第 见 的 操作 : 

(1) 同 关 联 数组 添加 配对 。 

(2) 从 关联 数组 内 删除 配对 。 

(3) 修改 关联 数组 内 的 配对 。 





(4) 根据 已 知 的 键 寻找 配对 。 


字典 问题 是 设计 一 种 能 够 具备 关联 数组 特性 的 数据 结构 。 解 决 字典 
问题 的 常用 方法 是 利用 散 列 表 ， 但 有 些 情 况 也 可 以 直接 使 用 有 地 址 的 数 
组 、 二 又 树 ， 或 者 其 他 结构 。 


许多 程序 设计 语言 内 置 基 本 的 数据 类 型 ， 提 供 对 关联 数组 的 支持 。 
而 Content-addressable memory 则 是 硬件 层面 上 实现 对 关联 数组 的 支持 。 








2. 散 列表 

散 列 表 (Hash table， 也 叫 哈 希 表 ) ， 是 根据 关键 字 (Key value) 
而 直接 访问 在 内 存 存储 位 置 的 数据 结构 。 即 把 键 值 通过 一 个 函数 的 计 
算 ， 了 映射 到 表 中 一 个 位 置 来 访问 记录 ， 加 快 了 碍 找 速度 。 这 个 映射 函数 
称 作 散 列 函 数 ， 存 放 记 录 的 数组 称 作 散 列表 。 


1.10.6 字典 的 函数 


跟前 面 押 讲 述 的 其 他 对 象 闫 似 ， 字 典 也 有 一 些 函 数 。 通 过 这 些 函 
数 ， 能 够 实现 对 字典 的 操作 。 

1.copy 和 deepcopy 

找 贝 是 copy 的 首 译 ， 标 准 的 汉语 翻译 是 “复制 ”。 


在 一 般 的 理解 中 ，copy 就 是 将 原来 的 东西 再 做 一 份 。 但 是 ， 在 
Python 里面 〈 旋 至 于 很 多 编程 语言 中 ) ，copy 可 不 是 那么 简单 的 。 














这 样 做 是 不 是 束 得 到 了 两 个 5 了 呢 ? 表面 上 看 似乎 是 ， 但 是 ， 不 要 
未 记 在 前 面 反复 提 到 的 : 对 象 有 类 型 ， 变 量 无 类 型 ， 正 是 因为 这 句 话 ， 
变量 其 实 是 一 个 标签 。 不 妨 请 出 法 宝 : id0， 专 门 查 看 内 存 中 的 对 象 纺 





>>> id(a) 
139774080 
>>> id(b) 
139774080 





果然 ， 并 没有 两 个 5， 束 一 个 ， 只 不 过 是 贴 了 两 张 标签 而 已 。 这 种 
现象 普 裔 存在 于 Python 的 多 种 数据 类 型 中 。 其 他 的 束 不 演示 了 ， 束 仅 看 
看 dict 类 型 。 


>>> ad = {"name":"qiwsir", "lang":"python"} 

>>> bd = ad 

>>> bd 

{'lang': 'python', 'name': 'giwsir'} 
>>> id(ad) 

3072239652L 

>>> id(bd) 

3072239652L 


又 是 一 个 对 象 贴 了 两 个 标签 ， 这 是 用 赋值 的 方式 实现 的 所 谓 “ 假 装 
拷贝 ”。 那 么 如 果 用 copy 的 方法 呢 ? 


>>> cd = ad.copy() 

>>> cd 

{'lang': 'python', 'name': 'giwsir'} 
>>> id(cd) 

3072239788L 


这 次 得 到 的 cd 跟 原 来 的 ad 古 不 同 的 ， 它 在 内 存 中 男 习 了 一 个 空间 。 
如 采 我 尝试 修改 cd， 应 该 对 原来 的 ad 不 会 造成 任何 影 啊 。 





>>> cd["name"] = "itdiffer.com" 

>>> cd 

{'lang': 'python', 'name': 'itdiffer.com'} 
>>> ad 

{'lang': 'python', 'name': 'giwsir'} 


真 的 跟 推理 一 模 一 样 。 所 以 ， 只 要 理解 了 “变量 ”是 对 象 的 标签 ， 对 
象 有 类 型 而 变量 无 类 型 ， 就 能 正确 推 新 出 Python 能 够 提供 的 结果 。 刚 才 
己 经 看 到 了 ，bd 和 ad 引用 了 同一 个 内 存 对 象 。 


>>> bd 

{'lang': 'python', "name': 'giwsir'} 
>>> bd["name"] = "laoqi" 

>>> ad 


{'lang': 'python', "name': 'lJaogi'} 


>>> bd 
{'lang': 'python', "name': 'laogi'} 


修改 了 bd 所 对 应 的 “对 象 ”，ad 的 “对 象 " 也 变 了 。 
然而 ， 事 情 并 没有 那么 简单 ， 下 面 看 仔细 一 点 ， 否 则 就 迷茫 了 。 


>>> x 
>>> y 
>>> y 
{'lang': ['python', 'java', 'c'], 'name': 'qiwsir'} 
>>> id(x) 

3072241012L 

>>> id(y) 

3072241284L 


y 是 从 x 拷贝 过 来 的 ， 两 个 在 内 存 中 是 不 同 的 对 象 。 


{"name":"qiwsir", "lang": ["python"™, "java", “| 
x.copy() 








>>> yl["lang"].remove("c") 





在 y 所 对 应 的 字典 对 象 中 ， 键 "ang" 的 值 是 一 个 列表 ， 为 
['python'"，'java'"，'c']， 这 里 用 remove() 删 除 其 中 的 一 个 元 素 "c"。 删 除 之 
后 ， 这 个 列表 变 为 : ['python'，'java']。 


>>> y 
{'lang': ['python', 'java'], 'name': 'qdqiwsir'} 





那么 ，x 所 对 应 的 字典 中 ， 这 个 列表 变化 了 吗 ? 应 该 没有 变化 ， 因 
为 按照 前 面 所 讲 的 ， 它 是 另外 一 个 对 象 ， 两 个 互 不 干扰 。 


>>> x 
{'lang': ['python', 'java'], 'name': 'qdqiwsir'} 





仔细 观察 ， 是 不 是 有 点 出 平 意料 呢 ? 我 没有 作 潍 哦 。 如 果 不 信 ， 囊 
按照 操作 上 自己 在 交互 模式 中 试 试 ， 是 不 是 也 能 够 得 到 这 个 结果 呢 ? 这 是 
为 什么 ? 


但 是 ， 如 果 要 操作 男 外 一 个 键 值 对 : 





>>> y["name"] 二 "laoqi" 

>>> y 

{'lang': ['python', 'java'], 'name': 'laoqi'} 
>>> x 


{'lang': ['python', 'java'], 'name': 'qdqiwsir'} 








前 面 所 说 的 原理 是 有 效 的 ， 为 什么 当 值 是 列表 的 时 候 就 不 奏效 了 


呢 ? 
要 破解 这 个 迷 局 还 得 用 id0: 


>>> id(x) 
3072241012L 
>>> id 
3072241284L 


Xx 和 y 对 应 着 两 个 不 同 的 对 象 ， 的 确 如 此 。 但 这 个 对 象 〈 字 典 ) 是 由 
两 个 键 值 对 组 成 的 ， 其 中 一 个 键 的 值 是 列表 。 


>>> id(x["lang"]) 
3072243276L 
>>> id(y["lang"]) 
3072243276L 


发 现 了 这 样 一 个 事实 ; 列表 是 同一 个 对 象 。 
但 是 ， 作 为 字符 串 为 值 的 那个 键 值 对 分 属 不 同 的 对 象 。 


>>> id(x["name"]) 
3072245184L 
>>> id(y["name"]) 
3072245408L 


这 个 事实 束 说 明了 为 什么 修改 一 个 列表 ， 男 外 一 个 也 跟着 修改 ; 而 
修改 一 个 字符 串 ， 男 外 一 个 不 跟随 的 原因 了 。 


但 是 ， 似 乎 还 没有 解 开 深层 的 原因 。 深 层 的 原因 -Python 存储 的 对 
象 类 型 〈 在 不 少 地 方 也 用 “数据 类 型 > 的 说 法 ， 其 实 两 者 是 一 样 的 , “对 
象 " 和 “数据 ?在 Python 中 等 同 ， 不 用 区 分 ) 特点 有 关 ，Python 只 存储 基本 
类 型 的 数据 ， 比 如 int、str， 对 于 不 是 基础 类 型 的 ， 比 如 字典 的 值 是 列 
表 ，Python 不 会 在 锐 复 制 的 那个 对 象 中 重新 存储 ， 而 是 用 引用 的 方式 ， 
指 问 原来 的 值 。 退 俗 地 说 ，Python 在 所 执行 的 复制 动作 中 ， 如 果 是 基本 
类 型 的 数据 ， 束 在 内 存 中 重新 建 个 寅 ， 如 果 不 是 基本 类 型 的 ， 束 不 新 建 
帘 了 ， 而 是 用 标签 引用 原来 的 寅 。 即 如 果 比 较 简单 ， 随 便 建立 新 帘 即 
We 











所 以 ， 把 用 copy0 实 现 的 拷贝 称 之 为 “ 浅 拷贝 "(不仅 Python， 很 多 


语言 都 有 “ 浅 拷贝 "。 顾 名 思 闵 ， 没有 解决 深层 次 问题 。 言 外 之 意 ， 还 有 
能 够 解决 深层 次 问题 的 方法 ) 。 


与 “ 浅 找 贝 " 对 应 ， 在 Python 中 ， 还 有 一 个 “ 深 找 贝 ”(deep copy) 。 
不 过 ， 要 用 import 导 入 一 个 模块 。 


>>> import copy 

>>> Z = copy.deepcopy(x) 

>>> Zz 

{'lang': ['python', 'java'], 'name': 'qdqiwsir'} 


用 copy.deepcopy0 深 堵 贝 了 一 个 新 的 副本 ， 用 idO) 来 勘察 一 番 : 


>>> id(x["1lang"]) 
3072243276L 
>>> id(z["lang"]) 
3072245068L 





果然 是 男 外 一 个 “ 富 ?， 不 是 引用 了。 如 果 按 照 这 个 结果 ， 修 改 其 中 
一 个 列表 中 的 元 素 ， 应 该 就 不 影响 另外 一 Ts 





>>> x 

{'lang': ['python', 'java'], 'name': 'qdqiwsir'} 
>>> x["lang"].remove("java") 

>>> x 

{'lang': ['python'], 'name': 'qdqiwsir'} 

>>> z 

{'lang': ['python', 'java'], 'name': 'qdqiwsir'} 


果然 如 此 ， 再 试 试 才 过 瘾 呀 。 


>>> x["lang"].append("c++") 
>>> x 
{'lang': ['python', 'c++'], 'name': 'giwsir'} 


这 就 是 所 谓 的 浅 拷贝 和 深 揽 贝 。 


2.clear 


在 交互 模式 中 ， 用 help 是 一 个 很 好 的 习惯 。 


>>> help(dict.clear) 
clear(...) 
D.clear() -> None. Remove all items from D. 





这 是 一 个 清空 字典 中 所 有 元 素 的 操作 。 


>>> a = {"name":"qiwsir"} 
>>> a.clear() 
>>> a 


{} 


dear 的 含义 是 将 字典 清空 ， 得 到 的 是 “ 空 "字典 。 它 和 del 有 着 很 大 的 
区 别 ，del 是 将 字典 删除 ， 内 存 中 就 没有 它 了 ， 并 不 是 为 “ 空 ”(“ 空 "和 无 
是 有 区 别 的 ， 至 少 在 编程 语言 中 有 区 别 。 在 其 他 方面 也 有 区 别 ， 比 
如 “色即是空 *， 不 能 是 “无 " 吧 ) 。 





>>> del a 

>>> a 

Traceback (most recent call last): 
File "<stdin>", line 1, in <module> 

NameError: name 'a' is not defined 


果然 删除 了 。 


男 外 ， 如 果 要 清空 一 个 字典 ， 还 能 够 使 用 a={} 这 种 方法 ， 但 这 种 方 
法 的 本 质 是 将 变量 a 转 辣 了 {} 这 个 对 象 ， 那 么 原来 的 昵 ? 原 来 的 成 为 了 
呈 线 的 风 第 。 这 样 的 东西 在 Python 中 称 之 为 垃圾 ， 而 且 Python 能 够 自动 
将 这 样 的 垃圾 回收 。 读 者 就 不 用 关心 它 了 ， 反 正 Python 会 处 理 的 。 








3.get 和 setdefault 
get 的 合 义 是 : 


get(...) 
D.get(k[,d]) -> D[k] if k in D, else d. dd defaults to None. 





注意 ， 在 这 个 说 明 中 ，“ifk in D” 就 返回 其 值 。 


>>> d 

{'lang': 'python'} 
>>> d.get("lang") 
'python' 


dict.get() 束 是 要 得 到 字典 中 杀 个 键 的 值 ， 只 是 它 没 有 那么 “ 严 历 ” 宇 
了 。 因 为 类 似 获 得 字典 中 键 值 的 方法 ， 如 d['lang"] 就 能 得 到 对 应 的 











值 "python"， 可 是 ， 如 果 要 获取 的 键 不 存在 : 
>>> print d.get("name") 
None 
>>> d["name"] 
Traceback (most recent call last): 


File "<stdin>", line 1, in <module> 
KeyError: 'name’ 


这 就 是 dict.getO 〇 和 dict['key'"] 的 区 别 。 
让 如 果 键 不 在 字典 中 ， 会 返回 None， 这 是 一 种 情况 ， 另 外 还 可 以 这 





>>> d = {"lang":"python"} 

>>> newd = d.get("name"，'qiwsir ') 
>>> newd 

'qiwsir' 

>>> d 

{'lang': 'python'} 


以 d.get (Cname"，"qiwsir ) 的 方式 ， 如 果 不 能 得 到 键 "name" 的 值 ， 
就 返回 后 面 指定 的 值 "qiwsir"。 这 就 是 文档 中 D[kJif k in D，else d. 的 含 
义 ， 这 样 做 并 没有 影响 原来 的 字典 。 


另外 一 个 跟 get 在 功能 上 有 相似 地 方 的 是 D.setdefault (k) ， 其 售 


日 
XE : 








setdefault(...) 
D.setdefault(k[,d]) -> D.get(k,d), also set D[k]=d if k not in D 


首先 ， 它 要 执行 D.get(k，d) 束 跟 前 面 一 样 了 ， 然 后 ， 进 一 步 执 行 
本 如 采 键 k 不 在 典 中 ， 束 在 字典 中 增加 这 个 键 值 对 。 妆 
然 ， 如 果 有 就 没有 必要 执行 这 一 步 了 。 


>>> d 

{'lang': 'python'} 

>>> d.setdefault("lang") 
'python' 


在 字典 中 ， 有 "lang" 这 个 键 ， 就 返回 它 的 值 。 


>>> d.setdefault("name", "qiwsir") 


'qiwsir' 
>>> d 
{'lang': 'python', 'name': 'giwsir'} 


在 字典 中 没有 "name" 这 文 个 键 ， 于 是 返回 
d.setdefault 〈"name"，"qiwsir") 指定 的 值 "qiwsir"， 并 且 将 键 值 
对 mamec"qiwsir" 添 加 到 原来 的 字典 中 。 


如 采 这 样 操作 : 


>>> d.setdefault("web'") 


什么 也 没有 返回 吗 ? 不 是 ， 返 回 了 ， 只 不 过 没有 显示 出 来 ， 如 果 你 
用 print 就 能 看 到 了 。 因 为 这 里 返回 的 是 一 个 None， 不 妨碍 看 一 下 那个 字 


Wn 


>>> d 
{'lang': 'python', 'web': None, 'name': 'qdqiwsir'} 


键 "web" 的 值 成 为 了 None。 


4.items/iteritems, keys/iterkeys, values/itervalues 


这 ee i 并 且 这 三 组 有 相似 的 地 方 。 在 这 里 
“0 下 第 一 组 ， 其 余 两 组 ， 我 想 任 借读 者 的 聪明 知 芒 是 不 在 话 下 


>>> help(dict.items) 
items(...) 
D.items() -> list of D's (key, value) pairs, as 2-tuples 


这 种 获取 帮助 信息 的 方法 是 惯用 的 仪 俩 了 ， 和 希望 读者 能 熟悉 ， 并 在 
目 己 的 代码 生涯 中 常用 。D.items() 能 够 得 到 一 个 天 于 字典 的 列表 ， 列 表 
中 的 元 素 是 由 字典 中 的 键 和 值 组 成 的 元 组 。 例 如 ; 


>>> dd = {"name":"qiwsir", "lang":"python", "web":"www.itdiffer.com"} 
>>> dd_kv = dd,items() 

>>> dd_kv 

[('lang', 'python'), ('web', 'www.itdiffer.com'), ('name', "qiwsir')] 


显然 ， 是 有 返回 值 的 。 这 个 操作 在 后 面 要 讲 到 的 循环 中 将 有 很 大 的 


作用 。 


跟 items 类 似 的 是 iteritems， 这 个 词 的 特点 是 由 iter 和 items 拼 接 而 成 
的 ， 后 部 分 items 束 不 用 说 了 ， 肯 定 是 在 告诉 我 们 ， 得 到 的 结果 跟 
D.items0 的 结果 类 似 。 还 有 一 个 iter 是 什么 意思 ? 前 面 我 提 到 了 一 个 
词 “iterable”， 它 的 含义 是 “可 和 迭代 的 >”， 这 里 的 iter 是 指名 词 iterator 的 前 部 


分 ， 意 思 是 “ 友 代 器 ”。 合 起 来 ，"iteritems" 的 含义 就 是 : 





iteritems(...) 
D.iteritems() -> an iterator over the (key, value) items of D 


你 看 ， 学 习 Python 不 是 什么 难事 ， 只 要 充分 使 用 帮助 文档 就 好 了 。 
这 里 告诉 我 们 ， 得 到 的 是 一 个 “和 欠 代 器 ” 〈 关 于 什么 是 友 代 器 ， 以 及 相关 
的 内 容 ， 后 续 会 详细 讲述 ) ， 这 个 适 代 器 是 关于 “D.items0” 的 。 看 个 例 
子 束 明白 了 。 


>>> dd 

{'lang': 'python', "web': 'www.itdiffer.com', "name': 'qiwsir'} 

>>> dd_iter = dd,iteritems() 

>>> type(dd_iter) 

<type 'dictionary-itemiterator'> 

>>> dd_iter 

<dictionary-itemiterator object at Oxb72b9a2c> 

>>> list(dd_iter) 

[('lang', 'python'), ('web', 'www.itdiffer.com'), ('name', "qiwsir ')] 


得 到 的 dd_iter 是 一 个 'dictionary-itemiterator 类 型 ， 不 过 这 种 迭代 器 
类 型 的 数据 不 能 直接 输出 ， 必 须 用 list0 转 换 一 下 ， 才 能 看 到 里 面 的 真 面 
目 。 


另外 两 组 舍 义 跟 这 个 相似 ， 只 不 过 是 得 到 key 或 者 value。 下 面 仅 列 
举 一 下 例子 ， 有 具体 内 容 ， 读 者 可 以 目 行 在 交互 模式 中 看 文档 。 


>>> dd 

{'lang': 'python', "web': 'www.itdiffer.com', "name': 'qiwsir 
>>> dd.Kkeys() 

['lang', 'web', 'name'] 

>>> dd.values() 

['python', 'www.itdiffer.com', 'qiwsir'] 


这 里 先 交 代 一 句 ， 如 果 要 实现 对 “ 键 值 ” 对 或 者 “ 键 "或 者 “ 值 ” 的 循 
环 ， 用 迭代 器 的 效率 会 高 一 些 。 对 这 人 句 话 的 理解 ， 继 续 阅 读本 书 就 能 找 
到 解释 。 


5.pop 和 popitem 


还 记得 删除 列表 中 元 素 的 函数 是 哪个 吗 ? pop 和 remove， 这 两 个 的 
区 别 在 于 : list.remove (x〉 用 来 删除 指定 的 元 素 ， 而 lispop〈[ 上 器 ) 用 于 
删除 指定 索引 的 元 素 ， 如 果 不 提 供 索 引 值 ， 就 默认 删除 最 后 一 个 。 


在 字典 中 ， 也 有 删除 键 值 对 的 函数 。 








pop(...) 
D.pop(k[,d]) -> v, remove specified key and return the corresponding value. 


If key is not found, d is returned if given, otherwise KeyError is raised 


D.pop(k[，d]) 是 以 字典 的 键 为 参数 ， 删 除 指 定 键 的 键 值 对 ， 当 
然 ， 如 果 输 入 对 应 的 值 也 可 以 ， 那 个 是 可 选 的 。 


>>> dd 

{'lang': 'python', 'web': 'www.itdiffer.com', 'name': 'qgiwsir'} 
>>> dd.pop("name") 

'qiwsir' 


删除 指定 键 "name"， 返 回 了 其 值 "qiwsir"。 这 样 ， 在 原 字 典 
中 ,，“name':qiwsir” 这 个 键 值 对 就 被 删除 了 。 


>>> dd 
{'lang': 'python', 'web': 'www.itdiffer.com'} 





值得 注意 的 是 ，pop 函 数 中 的 参数 是 不 能 省 略 的 ， 这 跟 列 表 中 的 pop 
有 所 不 同 。 


>>> dd.pop() 
Traceback (most recent call last): 
File "<stdin>", line 1, in <module> 
TypeError: pop expected at least 1 arguments, got 0 


如 果 要 删除 字典 中 没有 的 键 值 对 ， 也 会 报错 。 


>>> dd.pop("name") 

Traceback (most recent call last): 
File "<stdin>", line 1, in <module> 

KeyError: 'name’ 


有 意思 的 是 D.popitem(0 跟 listpopO0 有 相似 之 处 ， 不 用 写 参数 
(listpopO 可 以 不 写 参数 ) ， 但 是 ，D.popitem() 不 是 删除 最 后 一 个 ，dict 





a 也 就 没有 最 后 和 最 完了， 它 是 随机 删除 一 个 ， 并 将 所 删除 的 
返回 。 


popitem(...) 
D.popitem() -> (k, v), remove and return Some (key, value) pair as a 
2-tuple; but raise KeyError if D is empty. 


如 果 字 典 是 空 的 ， 束 要 报错 了 


>>> dd 

{'lang': 'python', 'web': 'www.itdiffer.com'} 
>>> dd.popitem() 

('lang', 'python') 

>>> dd 

{'web': 'www.itdiffer.com'} 


成 功 地 删除 了 一 对 ， 注 意 是 随机 的 ， 不 古 删 除 前 面 显示 的 最 后 一 
个 ， 你 做 同样 的 操作 ， 或 许 删 除 的 对 象 跟 我 删除 的 不 一 样 。 并 且 返 回 了 
删除 的 内 容 ， 返 回 值 是 元 组 类 型 ， 且 其 元 又 为 所 删除 的 键 和 值 。 


>>> dd.popitems() 
Traceback (most recent call last): 
File "<stdin>", line 1, in <module> 
AttributeError: 'dict' object has no attribute 'popitems' 











音 了 ? 注意 看 提示 信息 ， 果 然 错 了 。 注 意 是 popitem， 不 要 多 了 s， 
前 面 的 D.items0O) 中 包含 ， 是 复数 形式 ， 说 明 它 能 够 返回 多 个 结果 (多 个 
元 组 组 成 的 列表 ) ， 而 在 D.popitem() 中 ， 一 次 只 能 随机 删除 一 对 键 值 
2 并 以 一 个 元 组 的 形式 返回 ， 所 以 ， 要 用 单数 形式 ， 不 能 用 复数 形式 





>>> dd.popitem() 
('web', 'www.itdiffer.com') 
>>> dd 


{} 


都 删 了 ， 字 — 典 成 空 的 了 。 如 果 再 删 ， 会 怎么 样 ? 


>>> dd.popitem() 
Traceback (most recent call last): 

File "<stdin>", line 1, in <module> 
KeyError: "popitem(): dictionary is empty' 


报错 信息 中 明确 告知 ， 字 典 已 经 是 空 的 了 ， 没 有 能 删 的 东西 了 。 


6.update 
update()， 看 名 字 束 猜测 到 一 二 了 ， 是 不 是 更 新 字典 内 容 呢 ?的 确 





日 
XE o 
update(...) 
D.update([E, ]**F) -> None. Update D from dict/iterable E and F. 
If E present and has a .keys() method, does: for k in E: D[k] = E[K] 
If E present and lacks .keys() method, does: for (k, v) in E: D[k] = v 


In either case, this is followed by: for k in F: D[k] = F[k] 


看 样子 这 个 函数 有 点 复 傈 ， 不 要 着 急 ， 通 过 实验 可 以 一 点 一 上 扣 勤 揭 
明白 。 


首先 ， 这 个 函数 返回 值 是 None， 它 的 作用 就 是 更 新 字典 。 其 参数 可 
以 是 字典 或 者 茶 种 可 运 代 的 对 象 。 





>>> d1 = {"lang":"python"} 
>>> d2 = {"song":"I dreamed a dream"} 
>>> di1.update(d2) 


>>> d1 

{'lang': 'python', 'song': 'I dreamed a dream'} 
>>> d2 

{'song': 'I dreamed a dream'} 


这 样 就 把 字典 d2 更 新 纳入 了 dl 那个 字典 ， 于 是 d1 中 就 多 了 一 些 内 
容 ， 因 为 把 d2 的 内 容 包含 进来 了 。 当 然 d2 还 存在 ， 并 没有 受到 影响 。 


还 可 以 用 下 面 的 方法 更 新 : 





>>> d2 

{'song': 'I dreamed a dream'} 

>>> d2.update([("name", "qiwsir"), ("web","itdiffer.com")]) 

>>> d2 

{'web': 'itdiffer.com', 'name': 'qiwsir', 'song': 'I dreamed a dream'} 


列表 内 的 元 组 是 键 值 对 。 


7.has_key 


这 个 函数 的 功能 是 判断 字典 中 是 否 存 在 茶 个 键 。 








has_key(...) 


D.has_key(k) -> True if D has a key k，else False 


跟前 一 节 中 过 到 的 k in D 类 似 。 


>>> d2 

{'web': 'itdiffer.com', 'name': 'qiwsir'， 'song': 'I dreamed a dream'} 
>>> d2.has_key("web") 

True 


>>> "web" in d2 


关于 dict 的 函数 似乎 不 少 。 不 用 着 急 ， 也 不 用 担心 记 不 住 ， 因 为 根 
本 不 需要 记忆 ， 只 要 会 用 搜索 即 可 。 








L111 二 





Python 是 一 个 发 展 的 语言 ， 尽 管 前 面 已 丝 有 好 几 种 对 象 类 型 了 ， 但 
是 ， 从 实践 的 角度 看 还 不 够 ， 所 以 ， 又 有 了 名 暂 “ 集 合 ” 的 这 种 类 型 。 当 
然 ， 对 象 类 型 本 质 上 是 目 己 可 以 定义 的 ， 要 想 学 会 自己 定义 ， 请 继续 阅 
读本 书 ， 不 要 半途 而 上 废 ,“ 而 世 之 奇伟 、 现 怪 ， 非 第 之 观 ， 沼 在 于 险 
远 ， 而 人 之 所 罕 至 硬 ， 故 非 有 志 者 不 能 至 也 。”( 王 安 石 《 游 讲 禅 山 
We 


另外 ， 也 不 要 担心 记 不 住 ， 你 只 要 记 住 爱 因 斯 坦 说 的 就 好 了 : 


爱 因 斯 坦 在 美国 演讲 ， 有 人 问 : “你 可 记得 声音 的 速度 是 多 少 ? 
如 何 记 下 许多 东西 ? ” 

爱 因 斯 坦 轻 松 答 道 :“ 声 音 的 速度 是 多 少 ， 我 必须 查 套 典 才能 
答 。 因 为 我 从 来 不 记 在 辞典 上 已 经 印 着 的 东西 ， 我 的 记忆 力 是 用 来 记忆 
书本 上 没有 的 东西 。” 


多 么 霸气 的 回答 ， 这 回答 不 仅 霸 气 ， 还 告诉 我 们 一 种 方法 : 只 要 是 
能 够 通过 某 种 方法 奏 找 到 的 ， 惑 不 需要 记忆 。 


各 种 对 象 类 型 都 可 以 通过 下 述 方法 但 不 限于 这 些 方法 碍 到 : 


。 交互 模式 下 用 dir() 或 者 help()。 
。 使 用 Google。 
上 述 方法 从 本 书 开 始 就 不 断 强调 和 示范 ， 目 的 就 在 于 提示 读者 要 掌 
握 方法 ， 而 不 是 记忆 知识 。 


对 学 过 的 对 象 类 型 做 个 归纳 整理 : 
能 够 索引 的 ， 如 lisVystr， 其 中 的 元 素 可 以 重复 。 


可 变 的 ， 如 lisVydict， 即 其 中 的 元 素 / 键 值 对 可 以 原 地 修改 。 
不 可 变 的 ， 如 stvint， 即 不 能 进行 原 地 修改 。 
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= 


























。 无 索引 序列 的 ， 如 dict， 即 其 中 的 元 素 〈 键 值 对 ) 没有 排列 顺序 。 


1.11.1 创建 集合 





集合 的 英文 是 set， 翻 译 过 来 叫 作 “集合”?。 它 的 特点 是 : 有 的 可 变 ， 
有 的 不 可 变 ; 元 素 无 次 序 ， 不 可 重复 。 


如 果 说 元 组 〈tuple) 算是 列表 Uist〉 和 字符 串 (str) 的 杂 合 ， 那 
么 集合 (set) 则 可 以 堪 称 是 list 和 dict 的 杂 合 。 


集合 拥有 类 似 字典 的 特点 : 可 以 用 { 花 括号 来 定义 ;， 其 中 的 元 素 没 
有 序列 ， 也 就 是 非 序列 类 型 的 数据 ， 而 且 和 集合 中 的 元 素 不 可 重复 ， 这 就 
类 似 于 dict 键 。 

集合 也 有 一 点 列表 的 特点 : 有 一 种 集合 可 以 在 原 处 修改 。 


通过 实验 ， 逐 步 理 解 创 建 set 的 方法 : 














>>> si = set("qiwsir") 
>>> si1 
set(['q', Se Sy i 'w']) 


把 字符 串 中 的 字符 拆 解 开 形 成 了 集合 。 特 别 注 意 观 察 : qiwsir 中 有 
两 个 1， 但 是 在 sl 中 只 有 一 个 i， 也 就 是 集合 中 元 系 不 能 重复 。 





>>> S2 = set([123, "google", "face", "book", "facebook", "book"]) 
>>> s2 
set(['facebook', 123, 'google', 'book', 'face']) 





在 创建 集合 的 时 候 ， 如 果 发 现 了 重复 的 元 了 么 ， 就 会 过 滤 一 下 ， 剩 下 
不 重复 的 。 而 且 ， 从 s2 的 创建 可 以 看 出 ， 碍 看 结果 时 显示 的 元 素 排列 顺 
序 与 开始 建立 时 不 同 ， 完 全 是 随意 显示 的 《怎么 能 说 明 是 随机 的 呢 ? 读 
者 有 没有 办 法 ? ) ， 这 说 明 集 合 中 的 元 素 没 有 序列 。 




















>>> s3 = {"facebook", 123} # 通 过 














{] 直接 创建 

















>>> S3 
set([123, 'facebook '] ) 


除了 用 set(O 来 创建 集合 ， 还 可 以 使 用 人 的 方式 ， 但 是 这 种 方式 不 所 
倡 使 用 ， 因 为 在 某 些 情况 下 ，Python 搞 不 清楚 是 字典 还 是 集合 。 看 看 下 
面 的 探讨 束 肥 现 问 题 了 。 





>>> s3 = {"facebook", [1,2,'a'], {"name":"python", "lang":"english"}, 123} 
Traceback (most recent call last): 

File "<stdin>", line 1, in <module> 
TypeError: unhashable type: 'dict' 


>>> s3 = {"facebook", [1,2], 123} 

Traceback (most recent call last): 
File "<stdin>", line 1, in <module> 

TypeError: unhashable type: 'list' 





从 上 述 实 验 可 以 看 出 ， 通 过 {} 无 法 创建 含有 列表 或 者 字典 类 型 对 象 
元 素 的 集合 。 


认真 阅读 报错 信息 ， 有 这 样 的 词汇 : “unhashable”， 在 理解 这 个 词 
之 前 ， 先 看 它 的 反义词 “hashable”"， 很 多 时 候 翻 译 为 “可 哈 希 ”*”?:， 其 实 它 
有 一 个 不 是 音译 的 名 词 “ 散 列 ?”。 如 果 我 们 简单 点 理解 ， 某 数据 “不 可 哈 
锅 ”(unhashable〉 束 是 其 可 变 ， 如 列表 和 字典 都 能 原 地 修改 ， 束 是 
unhashable。 奋 则 ， 不 可 变 的 ， 类 似 字 符 串 那样 不 能 原 地 修改 的 束 是 
hashable 〈 可 哈 希 ) 。 


对 于 字典 类 型 的 对 象 ， 其 “ 键 * 必 须 是 hashable， 即 不 可 变 。 

现在 遇 到 的 集合 ， 其 元 素 也 是 “可 哈 希 ”的 。 上 面 的 例子 ， 试 图 将 字 
典 、 列 表 作 为 元 素 的 元 素 ， 就 报错 了 。 而 且 报 错 信 息 中 明确 告知 列表 和 
字典 是 不 可 哈 希 类 型 ， 言 外 之 意 ， 里 面 的 元 素 都 应 该 是 可 哈 希 类 型 。 


继续 探索 力 外 一 种 情况 : 

















>>> si 
set(['q', PI Oey 出 'w']) 
>>> s1[1] = "I" 
Traceback (most recent call last): 
File "<stdin>", line 1, in <module> 
TypeError: 'set' object does not support item assignment 


这 里 报错 ， 进 一 步 说 明 集 合 不 是 厅 列 类 型 ， 不 能 用 索引 方式 对 其 进 


行 修改 。 


根据 前 面 的 经 验 ， 类 型 名 称 函 数 能 够 实现 类 型 转换 ， 比 如 str0 束 是 
将 对 象 转化 为 字符 串 ， 同 理 ， 分 别 用 list0 和 setO 能 够 实现 集合 和 列表 两 
种 对 象 之 间 的 转化 。 








>>> s1 

set(['q', > Sl; i 'w']) 
>>> lst = list(s1) 

>>> lst 

['q', 二 直人 ‘i 'w'] 

>>> lst[1] = "I" 

>>> lst 

['q', "I" “SS 二 'w'] 


特别 说 明 ， 利 用 setO 建 立 起 来 的 集合 是 可 变 集合 ， 可 变 集 合 都 是 
unhashable 类 型 的 。 


1.11.2 ”集合 的 函数 


把 与 集合 有 关 的 函数 找 出 来 。 


>>> dir(set) 
['_and ', '_class '，' cmp ', '_ contains ', '_ delattr ', '_doc ', ' 





为 了 看 清楚 ， 我 把 双 男 线 “_“” 先 删除 掉 : 


'add', 'clear', 'copy', 'difference', 'difference update', 'discard', "intersection 


然后 用 helpO 可 以 找到 每 个 函数 的 具体 使 用 方法 。 


1.add 和 update 


>>> help(set.add) 
Help on method_descriptor: 
add(...) 


Add an element to a set. 
This has no effect if the element is already present. 


在 交互 模式 中 ， 可 以 看 到 : 








>>> a_set = {} # 我 想当然 地 认为 这 样 也 可 以 建立 一 个 
set 
>>> a_set.add("qiwsir") # 报 错 ! 看 错误 信息 。 





Traceback (most recent call last): 

File "<stdin>", line 1, in <module> 
AttributeError: 'dict' object has no attribute 'add' 
>>> type(a_set) #Python 认 为 我 建立 的 是 一 个 


dict 
<type 'dict'> 


{ 这 个 东西 在 dict 和 set 中 都 有 用 ， 但 是 ， 知 按照 上 面 的 方法 则 建立 
的 是 dict， 而 不 是 set。 这 是 Python 规定 的 ， 要 建立 set， 只 能 用 前 面 已 经 
看 到 的 创建 方法 了 。 

>>> a_set = {'a','i'} 


>>> type(a_set) 
<type 'set'> 


>>> a_set.add("qiwsir") # 增 加 一 个 元 素 
>>> a_set # 原 地 修改 


set(['i', 'a', 'giwsir']) 


>>> b_set = set("python") 

>>> type(b_set) 

<type 'set'> 

>>> b_set 

set(['h', 'o', i'n', on "Es, 'y']) 

>>> b_set.add("qiwsir") 

>>> b_set 

set(['h', oa ons 'p', Sy 'qiwsir', 'y']) 





>>> b_set.add( [1,2,3]) # 列 表 是 不 可 哈 希 的 ， 集 合 中 的 元 素 应 该 是 


hashable 类 型 。 


Traceback (most recent call last): 
File "<stdin>", line 1, in <module> 
TypeError: unhashable type: 'list' 


>>> b_set.add('[1,2,3]') ”# 可 以 这 样 





! 
>>> b_set 
set(['[1,2,3]', 'h', 'o', 'n', 'p', 't', 'qiwsir’', 'y']) 


除了 add0 之 外 ， 还 能 够 从 另外 一 个 集合 中 合并 过 来 元 又 ， 
set.update (s2) 。 


>>> help(set.update) 
update(...) 
Update a set with the union of itself and others. 


>>> si1 

set(['a', 'b']) 

>>> s2 

set(['github', 'qgiwsir']) 

>>> s1.update(s2) 

>>> si 

set(['a', 'qiwsir', 'b', 'github']) 
>>> S2 

set(['github', 'giwsir']) 


2. pop, remove, discard, clear 


>>> help(set .pop) 

pop(...) 
Remove and return an arbitrary set element. 
Raises KeyError if the set is empty. 


>>> b_set 
set(['[1,2,3]', 'h', on 'p', 't', 'qiwsir', 'y']) 
>>> b_set .pop() # 从 


set 中 任意 选 一 个 删除 ， 并 返回 该 值 








>>> b_set .pop() 


>>> b_set .pop() 


set(['n', 'p', 't', 'gqiwsir’', 'y']) 





>>> b_set .pop("n") # 如 果 要 指定 删除 某 个 元 素 就 报错 了 


Traceback (most recent call last): 


File "<stdin>", line 1, in <module> 
TypeError: pop() takes no arguments (1 given) 


set.popO 古 从 集合 中 随机 选 一 个 元 素 删除 并 将 这 个 值 返 回 ， 但 是 不 
能 指定 删除 某 个 元 素 。 报 错 信息 告诉 我 们 ，pop0 不 能 有 参数 。 此 外 ， 如 
东 集 合 是 空 的 了 ， 再 做 popO 操 作 也 报错 。 


但 是 人 否 可 以 删除 指定 元 素 ? 如果 可 以 ， 怎 么 办 ? 


>>> help(set.remove) 
remove(...) 


Remove an element from a set; it must be a member. 
If the element is not a member, raise a KeyError. 


会 有 办 法 的 ， 那 么 多 聪明 人 早 就 为 读者 想 好 了 一 个 函数 一 一 
remove() 一 一 setremove (obj) 中 的 obj， 必 须 是 set 中 的 元 素 ， 人 否则 就 报 
错 。 





>>> a_set 

set(['i', 'a', 'giwsir']) 

>>> a_set.remove("i") 

>>> a_set 

set(['a', 'qiwsir']) 

>>> a_set.remove("w") 

Traceback (most recent call last): 
File "<stdin>", line 1, in <module> 

KeyError: 'w' 


跟 remove (obj〉 类似 的 还 有 discard (obj) : 


>>> help(set.discard) 


discard(...) 
Remove an element from a set if it is a member. 
If the element is not a member, do nothing. 


与 help (set.remove) 进行 信息 对 比 ， 看 看 有 什么 不 同 。 关 键 在 于 如 
果 discard (obj) 中 的 obj 是 set 中 的 元 素 就 删除 ， 如 果 不 是 ， 丈 什么 也 不 
做 。 新 闻 就 要 对 比 痢 看 才 有 意思 ， 这 里 也 一 样 。 





>>> a_set.discard('a') 
>>> a_set 
set(['qiwsir']) 

>>> a_set.discard('b') 
>>> 


在 删除 上 还 有 一 个 绝 杀 ， 就 是 set.clear()， 它 的 功能 是 : Remove all 
elements from this set. (自己 在 交互 模式 下 help (set.clear) ) 。 


>>> a_set 
set(['qiwsir']) 

>>> a_set.clear() 

>>> a_set 

set([]) 

>>> bool(a_set) # 空 了 


, boo1 一 下 返回 


False. 
False 


1.11.3 ”补充 知识 


集合 也 是 一 个 数学 概念 〈 以 下 定义 来 目 维基 百科 ) : 


最 简单 的 说 法 是 最 原始 的 集合 论 一 一 朴 对 集合 论 中 的 定义 ， 集 合 就 
古 “ 一 扒 东 西 ?。 集 合 里 的 “东西 ? 叫 作 元 么 。 知 然 x 是 集合 A 的 元 素 ， 记 作 


XEA,。 


集合 是 现代 数学 中 一 个 重要 的 基本 概念 。 集 合 论 的 基本 理论 直到 19 
世纪 末 才 被 创立 ， 现 在 已 经 是 数学 教育 中 一 个 普遍 存 在 的 部 分 ， 在 小 学 
时 惑 开 始 学 习 3 了。 这 里 对 被 数学 家 们 称 为 "直观 的 ?或 “朴素 的 ?集合 论 进 
行 一 个 简短 而 基本 的 介绍 ;更 详细 的 分 析 可 见 朴素 集合 论 。 对 集合 进行 
严格 的 公理 推导 可 见 公理 化 集合 论 。 


在 计算 机 中 集合 是 什么 呢 ? 自 维基 百科 是 这 么 说 的 : 


在 计算 机 科学 中 ， 集 合 是 一 组 可 变数 量 的 数据 项 〈 也 可 能 是 0 个 ) 
的 组 合 ， 这 些 数据 项 可 能 共 孚 某 些 特征 ， 需 要 以 东 种 操作 方式 一 起 进行 
操作 。 一 般 来 讲 ， 这 些 数据 项 的 类 型 是 相同 的 ， 或 基 类 相同 〈 知 使 用 的 
语言 文 持 继承 ) 。 列 表 〈 或 数组 ) 通 第 不 修 认 为 是 集合 ， 因 为 其 大 小 固 
定 ， 但 事实 上 它 和 常常 在 实现 中 作为 傈 些 形式 的 集合 使 用 。 


RS 

















口 
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1.11.4 不 变 的 集合 


以 setO 创 立 的 集合 都 是 可 原 地 修改 的 集合 ， 或 者 说 是 可 变 的 ， 也 可 
以 说 是 unhashable。 


还 有 一 种 集合 不 能 原 地 修改 ， 这 种 集合 的 创建 方法 是 用 
frozenset()， 顾 名 思 义 ， 这 是 一 个 被 “冻结 ”的 集合 ， 当 然 是 不 能 修改 
的 ， 这 种 集合 就 是 hashable 类 型 可 哈 希 。 





>>> f_set = frozenset("qiwsir") 


>>> f_set 
frozenset(['qg', 'i', 's', 'r', 'w'] 
>>> f_set.add("python") # 报 错 ， 不 能 修改 


Traceback (most recent call last): 
File "<stdin>", line 1, in <module> 
AttributeError: 'frozenset' object has no attribute 'add' 


>>> a_set = set("github") # 对 比 看 一 看 








>>> a_set 

set(['b', 'g', "Ls 'h', TU" E> 

>>> a_set.add("python") 

>>> a_set 

set(['b', 'g', TL 'h', 'python', 'U', 't']) 


1.11.5 ”集合 运算 








唤醒 中 学 数学 (准确 说 是 高 中 数学 中 的 一 点 知识 ) 中 关于 集合 的 知 
识 ， 当 然 ， 如 果 你 是 茶 个 理工 科 的 专业 大 学 毕业 ， 应 该 更 熟悉 集合 之 间 
的 关系 。 

1. 元 素 与 集合 的 关系 

元 素 与 集合 就 一 种 关系 ， 要 么 属于 某 个 集合 ， 要 么 不 属于 。 


>>> aset 
set(['h', 'o', in', 'p', 由 'y']) 


>>> "a" in aset 
False 
>>> "h" in aset 


2 集合 与 集合 的 关系 
假设 两 个 集合 A、B 
(1) A 是 否 等 于 B， 即 两 个 集合 的 元 系 是 人 否 完 全 一 样 。 
在 交互 模式 下 实验 


>>> a 
set(['q', 上 S's i 'w']) 
>>> b 

set(['a', 'q', “人 se, '0']) 
>>> a == b 

False 

>>> a !=b 


(2) A 是 否 是 B 的 子 集 ， 或 者 反 过 来 ，B 是 否 是 A 的 超 集 ， 即 A 的 元 
素 是 否 也 都 是 B 的 元 素 ， 且 B 的 元 素 比 A 的 元 素数 量 多 。 


判断 集合 A 是 否 是 集合 B 的 子 集 ， 可 以 使 用 A<B， 返 回 True 则 是 子 
集 ， 否 则 不 是 。 男 外 ， 还 可 以 使 用 函数 A.issubset (B) 判断 。 

















>>> a 
set(['q', PL ES i 'w']) 
>>> C 

set(['q', 'i']) 

>>>c<a #C 十 


a 的 子 集 





True 
>>> c.issubset(a) # 或 者 用 这 种 方法 ， 

















判断 


= 














True 
>>> a.issuperset(c) # 判 断 











False 
>>> a.issubset(b) 
False 


(3) A、B 的 并 集 ， 即 A、B 所 有 元 素 ， 如 图 1-8 所 示 。 





AUB 


图 1-8 A、B 的 并 集 


可 以 使 用 的 符号 是 “*， 是 一 个 半角 状态 下 的 竖 线 ， 输 入 方法 是 在 贡 
文 状态 下 ， 按 下 “shift* 加 上 右 方 括号 右边 的 那个 键 。 表 达 式 是 A|B 也 可 
使 用 函数 A.union(B)〉， 得 到 的 结果 就 是 两 个 集合 并 集 ， 注 意 ， 这 个 结 
果 是 新 生成 的 一 个 对 象 ， 不 是 将 结合 A 扩充 。 





>>> a 
set(['q', 全 本 boy 人 'w']) 
>>> b 

set(['a', lo Wl “Ly "0 ]) 
>>> a | b # 可 以 有 两 种 方式 ， 结 果 一 样 








set(['a', 由 网 '0O', 'q', 0, Wl i 'w']) 
>>> a.union(b) 
set(['a', > “于 "0"; 'q', SS 机 'w']) 


(4) A、B 的 交集 ， 即 A、B 所 公有 的 元 素 ， 如 图 1-9 所 示 。 





A B A 门 B 


图 1-9 A、B 的 交集 


set(['q', sr 'w']) 

>>> b 

set(['a', 'q', ii '1', '0']) 
>>>a&b # 两 种 方式 ， 等 价 


set(['q', 'i']) 
>>> a.intersection(b) 
set(['q', 'i']) 


我 在 实验 的 时 候 ， 顺 手 襄 了 下 面 的 代码 ， 出 现 的 结果 如 下 ， 读 者 能 
解释 一 下 吗 ? 


>>> a and b 
set(['a', 'q', “二 ”7 “ 业 "0 ]) 


(5) A 相对 B 的 差 ( 补 )， 即 A 相对 B 不 同 的 部 分 元 素 ， 如 图 1-10 所 
示 。 





A B A=.B 


图 1-10 ”A 相对 B 的 差 ( 补 ) 


>>> a 

set(['q', 7 SS Wa 'w']) 
>>> b 

set(['a', 'q', ‘Ls; “ns "0 ]) 
>>> a - b 


sete([ Sty tr Ww) 
>>> a.difference(b) 
SEE TS re w]) 


(6) A、B 的 对 称 差 集 ， 如 图 1-11 所 示 。 





AA AZ&B 


[oy 





图 1-11 A、B 的 对 称 差 集 


>>> a 

set(['q', PL Lay i 'w']) 

>>> b 

set(['a', Ro i “了 "0 ]) 

>>> a.symmetric_difference(b) 
set(['a', 7 "0 0， ‘Ss 由 'w']) 








以 上 是 集合 的 基本 运算 。 在 编程 中 如 果 用 到 ， 可 以 用 前 面 说 的 方法 
查找 。 


第 2 章 ”语句 和 文件 


“ 呀 蚜 学 语 ? 是 小 孩子 成 长 的 必 经 阶段 ， 学 习 编 程 ， 到 这 里 就 是 “ 呀 
呀 学 语 * 的 阶段 。 从 本 章 开始 ， 将 使 用 已 经 学 习 过 的 基本 知识 ， 组 闭 成 
各 种 语句 ， 通 过 语句 向 计算 机 传达 自己 的 意愿 。 所 以 ， 读 者 将 从 本 章 收 
获 到 “ 呀 呀 学 语 ” 的 回忆 。 





2.1 运算 符 





在 编程 语言 中 运算 符 是 比较 多 样 化 的 ， 虽 然 已 经 在 前 面 了 解 了 各 种 
运算 符 和 其 优先 级 ， 但 是 ， 那 时 对 Python 的 理解 还 比较 肤浅 ， 现 在 要 温 
故而 知 新 ， 更 上 一 层 楼 。 


2.1.1 算术 运算 符 
四 则 运算 中 的 一 些 运 算 符 ， 如 加 减 滋 除 ， 对 应 的 符号 分 别 是 : 


+、-、*、/， 此 外 ， 还 有 求 余 数 的 “%” 等 ， 都 是 算术 运算 符 。 


列 出 一 个 表格 ， 将 所 有 的 运算 符 表 现 出 来 。 不 用 记 ， 但 是 要 认真 地 
看 一 看 ， 知 道 有 哪些 ， 如 果 以 后 用 到 ， 可 以 来 查 ， 如 表 2-1 所 示 。 


表 2-1 算术 运算 符 














a 


实 





加 ， 两 个 对 象 相 加 10+20 输出 结果 30 
减 ， 得 到 负数 或 是 一 个 数 减 去 另 一 个 数 10-20 输出 结果 -10 
乘 ， 两 个 数 相 乘 或 是 返回 一 个 被 重复 若干 次 的 字符 串 10* 20 输出 结果 200 
除 ，x 除 以 y 20/10 输出 结果 2 
取 余 ， 返 回 除法 的 余数 20%10 输出 结果 0 


答 ， 返回 x 的 了 次 震 10**2 输出 结果 100 






































取 整 除 ， 返 回 商 的 整数 部 分 9/2 输出 结果 4 .9.0/2.0 输出 结果 4.0 











读者 可 以 根据 中 学 的 数学 知识 ， 想 想 上 面 的 运算 符 在 混合 运算 中 应 
该 按照 什么 顺序 计算 ， 并 且 杀 目 试 试 ， 是 否 与 中 学 数学 中 的 规律 一 致 。 








2.12 比较 运 息 得 


所 谓 比 较 ， 就 是 将 两 个 东西 相 比 ， 比 如 做 家 长 的 经 常 把 自己 的 孩子 





跟 别 人 的 孩子 比较 ， 唯 恐 目 己 的 孩子 在 某 方面 莹 了 。 

在 计算 机 品级 语言 编程 中 ， 任 何 两 个 同一 类 型 的 量 都 可 以 进行 比 
较 ， 比 如 两 个 数字 可 以 比较 ， 两 个 字符 串 可 以 比较 。 不 同类 型 的 量 可 以 
比较 吗 ? 这 种 比较 没有 意义 ， 比 如 ， 二 两 肉 和 三 尺 布 如何 进 行 比较 ? 所 
以 ， 在 真正 的 编程 中 ， 我 们 要 谨慎 对 竺 这 种 不 同类 型 量 的 比较 。 


但 是 ， 在 某 些 语言 中 ， 人 允许 这 种 比较 ， 因 为 它们 在 比较 的 时 候 ， 都 
古 将 非 数 值 类 型 转化 为 数值 类 型 比较 。 


对 于 比较 运算 符 ， 在 小 学 数学 中 就 学 习 了 一 些 ， 大 于 、 小 于 、 等 
于 、 不 等 于 。 没 有 陌生 的 东西 ，Python 里 面 也 是 如 此 ， 如 表 2-2 所 示 。 


以 下 假设 变量 a 为 10， 变 量 b 为 20。 


表 2-2 ”比较 运算 符 














描 述 


等 于 (注意 ; 两 个 符号 ) 














不 等 于 
大 于 
小 于 
大 于 等 于 





























在 表 2-2 中 ， 显 示 比 较 的 结果 束 是 返回 True 或 者 False， 即 这 个 比较 
如 果 成 立 ， 束 为 真 ， 返 回 True， 若 返回 False， 则 说 明 比 较 不 成 立 。 


请 按照 下 面 的 方式 进行 比较 操作 ， 然 后 再 根据 上 自己 的 想象 进行 练 





>>> a=10 
>>> b=20 
>>> a > b 
False 

>>> a < b 
True 
> ad- == bb 
False 
>>> a != b 
True 
>>> a >= b 
False 
>>> a <= b 
True 


除了 数字 之 外 ， 还 可 以 对 字符 串 进行 比较 。 字 符 串 中 的 比较 是 按 
照 < 字 典 顺 序 ” 进 行 比较 的 ， 当 然 ， 这 里 说 的 是 英文 的 字典 。 





>>> a = "giwsir" 
>>> b = "python" 
>>> a > b 


True 


先 看 第 一 个 字符 ， 按 照 字 典 顺 序 ，q 大 于 p《 在 字典 中 ，dq 排 在 p 的 后 
面 ) ， 那 么 就 返回 结果 True。 


在 Python 中 ， 东 些 两 种 不 同类 型 的 对 象 ， 虽 然 可 以 进行 比较 ， 但 是 
不 赞成 这 样 进行 比较 。 





首先 谈 谈 什么 是 逻辑 ， 贺 宕 先 生 对 好 辑 有 一 个 分 类 : 
远 辑 分 两 种 ， 一 种 是 逻辑 ， 男 一 种 是 中 国人 的 人 逻辑 。 


这 种 分 类 的 确 非 第 精准 。 在 很 多 情况 下 ， 中 国人 有 很 奇特 的 逻辑 。 
但 是 ， 在 Python 中 ， 讲 的 是 逻辑 ， 不 是 中 国人 的 逻辑 。 


逻辑 (logic) ， 又 称 理 则 、 论 理 、 推 理 、 推 论 ， 是 有 效 推论 的 哲学 
研究 。 逻 辑 补 使 用 在 大 部 分 智能 活动 中 ， 但 主要 在 哲学 、 数 学 、 语 义学 
和 计算 机 科学 等 领域 内 被 视 为 一 门 学 科 。 在 数学 里 ， 多 辑 是 指 研究 东 个 
形式 语言 的 有 效 推论 。 








1. 布 尔 类 型 的 变量 


在 所 有 的 高 级 编程 语言 中 都 有 一 类 对 象 类 型 ， 被 称 之 为 布尔 型 ， 这 
是 用 一 个 人 的 名 字 来 命名 的 。 








乔治 -布尔 (George Boole，1815 年 一 1864 年 ) ， 英 格 兰 数学 家 、 哲 
家 。 


蛮 治 :布尔 是 一 个 皮 匠 的 儿子 ， 生 于 英格兰 的 林肯 。 由 于 家 境 贫 

， 布 尔 不 得 不 在 协助 养家 的 同时 为 自己 能 受 教 育 而 盏 斗 ， 不 省 怎么 
说 ， 他 成 了 19 世 纪 最 重要 的 数学 家 之 一 。 尺 管 他 考虑 过 以 牧师 为 业 ， 但 
终 还 是 决定 从 教 ， 而 且 不 久 就 开办 了 目 己 的 学 校 。 


在 备 读 的 时 候 ， 布 尔 不 满意 当时 的 数学 课本 ， 便 决定 阅读 伟大 数学 
家 的 论文 。 在 阅读 伟大 的 法 国 数 学 家 拉 格 明日 的 论文 时 ， 布 尔 有 了 变 分 
法 方面 的 新 发 现 。 变 分 法 是 数学 分 析 的 分 文 ， 它 处 理 的 是 寻求 优化 茶 些 
参数 的 曲线 和 曲面 。 


1848 年 ， 布 尔 出 版 了 《The Mathematical Analysis of Logic》， 这 是 
他 对 符号 逻辑 诸多 贡献 中 的 第 一 次 。 


1849 年 ， 他 被 任命 于 爱尔兰 科 元 的 星 后 学 院 ( 今 科 元 大 学 或 UCC) 
的 数学 教授 。1854 年 ， 他 出 版 了 《The Laws of Thought》， 这 是 他 最 著 
名 的 著作 。 在 这 本 书 中 布尔 介绍 了 以 他 的 名 字 命 名 的 布尔 代数 。 布 尔 撰 
0 这 些 课本 在 英国 一 直 使 用 到 19 世 纪 


YY 


孙 











于 王 油 








由 于 其 在 符号 逻辑 运算 中 的 特殊 贡献 ， 很 多 计算 机 语言 中 将 馆 辑 运 
算 称 为 布尔 运算 ， 将 其 结果 称 为 布尔 值 。 


布尔 所 创立 的 这 套 逻 辑 被 称 之 为 “布尔 代数 "”， 其 中 规定 只 有 两 种 
值 ，True 和 False， 正 好 对 应 计算 机 上 二 进 制 数 的 1 和 0。 上 所 以 ， 布 尔 代数 
和 计算 机 是 天 然 吻 合 的 。 

所 谓 布尔 类 型 就 是 返回 结果 为 1 (True) 或 0 (False) 的 数据 变量 。 

在 Python 中 《〈 其 他 高 级 语言 也 类 似 ) 有 三 种 运算 符 ， 可 以 实现 布尔 
类 型 的 对 象 间 的 运算 。 

2. 布 尔 运算 


布尔 运算 符 如 表 2-3 所 示 。 


3 





表 2-3 布尔 运算 符 


实 例 
如 果 x 为 False，x andy， 返 回 False， 否 则 返回 y 的 计算 值 


如 果 x 是 Trme，xory， 返 回 Trme， 否 则 返回 y 的 计算 值 




















如 果 X 为 Tme，notx， 返 回 False。 如 果 x 为 False， 返 回 True 


(1) and 


and， 翻 译 为 “与 "， 但 事实 上 ， 这 种 翻译 容易 引起 望 文生 义 的 理 
解 。 先 说 一 下 正确 的 理解 。A and B， 含 义 是 : 首先 运算 A， 如 果 人 A 的 值 
是 True， 就 计算 B， 并 将 B 的 结果 返回 做 为 最 终结 果 (如 果 B 是 False， 那 
么 AandB 的 最 终结 果 就 是 False， 如 果 B 的 结果 是 True， 那 么 AandB 的 
结果 就 是 True) ; 如 果 A 的 值 是 False， 就 不 计算 B 了 ， 直 接 返 回 False 作 
为 AandB 的 结果 。 


比如 : 


4>3 and 4<9， 首 先 看 4>3 的 值 ， 这 个 值 是 True， 再 看 4<9 的 值 ， 是 
True， 那 么 最 终 这 个 表达 式 的 结果 为 True。 











>>>4>3 and4<9 
True 


4>3 and 4<2， 先 看 4>3， 返 回 True， 再 看 4<2， 返 回 的 是 False， 那 么 
最 终结 果 是 False。 


>>>4>3 and4<2 
False 


4<3 and 4<9， 先 看 4<3， 返 回 为 False， 就 不 看 后 面 的 了 ， 直 接 返回 
(对 这 种 现象 ， 有 一 个 形象 的 说 法 ， 叫 作 “ 短 
路 ”) 。 


>>> 4<3and4< 2 
False 


前 面 说 容易 引起 望 文 生 义 的 理解 ， 就 是 有 很 多 人 认为 无 论 什么 时 候 
都 看 and 两 边 的 值 ， 知 值 都 是 True 则 返回 True， 和 若 有 一 个 是 False 就 返回 
False。 根 据 这 种 理解 得 到 的 结果 与 前 述 理解 得 到 的 结果 一 样 ， 但 是 ， 运 





算 量 不 一 样 。 
(2) or 
or， 翻 译 为 "或 >。 在 A or B 中 ， 它 是 这 么 运算 的 : 


if A == True: 
return True 
else: 
return B 





上 面 这 段 算是 伪 代 码 ， 所 谓 伪 人 代码， 就 不 是 真正 的 代码 ， 无 法 运 
行 。 但 是 ， 伪 代码 也 有 用 途 ， 残 是 能 够 以 类 似 代码 的 方式 表达 一 种 计算 
过 程 。 本 书 读者 应 该 能 对 这 段 伪 代码 有 一 个 大 概 的 理解 。 


下 面 再 加 上 每 行 的 注释 。 这 个 伪 代 码 跟 上 自然 的 瑞 语 差不多 了 。 











if A==True: # 如 果 
A 的 值 是 
True 

return True # 返 上 








True， 表 达 式 最 终结 果 是 


True 


else: # 人 否则 ， 也 就 是 
A 的 值 不 是 
True 

return B # 看 





B 的 值 ， 然 后 就 返回 





B 的 值 作为 最 终结 果 





根据 上 和 面 的 运算 过 程 举例 。 


>>> 4<3or4<9 
True 
>>> 4<3or4>9 
False 
>>> 4>3or4>9 
True 


(3) not 
not， 翻 译 成 <* 非 ?， 佐 以 为 非常 好 ， 不 论 面 对 什么 ， 就 是 要 否定 它 。 


>>> not(4>3) 
False 
>>> not(4<3) 
True 


关于 运算 符 问题 ， 其 实 不 止 上 面 这 些 ， 比 如 还 有 成 员 运 算 符 hm， 在 
后 面 的 学 习 中 会 逐渐 过 到 。 





2.2 ”人 简单 语句 





学 习 编程 序 ， 就 好 比 小 学 生 学 习 写 作 一 样 ， 先 学 会 一 些 词语 ， 就 等 
同 于 已 经 掌握 了 基本 的 对 象 类 型 ， 接 下 来 就 是 学 “造句 子 " 的 时 候 了 。 


在 编程 语言 中 ， 人 句子 被 称 之 为 “语句 ”。 


事实 上 ， 前 面 已 经 用 过 语句 了 ， 最 典型 的 print"Hello，World" 就 是 
语句 。 


为 了 能 够 严谨 地 阐述 这 个 概念 ， 抄 一 段 维基 百科 中 的 词 条 : 命令 式 











编程 


命令 式 编 程 〈 英 语 : Imperative programming) ， 是 一 种 描述 电脑 所 
需 做 出 的 行为 的 编程 范 型 。 几 乎 所 有 电脑 的 硬件 工作 都 是 指令 式 的 ， 几 
乎 所 有 电脑 的 硬件 都 是 设计 来 运行 机 器 码 ， 使 用 指令 式 的 风格 来 写 的 。 
较 高 级 的 指令 式 编 程 语言 使 用 变量 和 更 复杂 的 语句 ， 但 仍 依 从 相同 的 范 


型 。 











运算 语句 一 般 来 说 都 表现 了 在 存储 器 内 的 数据 进行 运算 的 行为 ， 然 
后 将 结果 存 入 存储 器 中 以 便 日 后 使 用 。 高 级 命令 式 编程 语言 更 能 处 理 复 
杂 的 表达 式 ， 可 能 会 产生 四 则 运算 和 函数 计算 的 结合 。 

一 般 高 级 语言 都 包含 如 下 语句 ，Python 也 不 例外 。 

(1) 循环 语句 : 容许 一 些 语句 反复 运行 数 次 。 可 依据 一 个 默认 的 
0 
忆 人 和信。 


(2) 条 件 语句 : 容许 仅 当 茶 些 条 件 成 立时 才 运 行 茶 个 区 块 。 人 否 
则 ， 这 个 区 块 中 的 语句 会 略 去 ， 然 后 按 区 块 后 的 语句 继续 运行 。 


(3) 无 条 件 分 支 语 句 ， 容许 运行 顺序 转移 到 程序 的 其 他 部 分 之 
中 。 包 括 跳 跃 〈 在 很 多 语言 中 称 为 Goto) 、 副 程序 和 Procedure 等 。 











循环 、 条 件 分 文 和 无 条 件 分 文 都 是 控制 流程 。 


当然 ，Python 中 的 语句 还 是 有 自己 的 特别 之 处 的 ( 别 的 语言 也 有 自 
己 的 特色 ) 。 下 面 就 开始 九 九 道 来 。 





2.2.1 print 
在 Python 2.x 中 ，Pprint 是 一 个 语句 ， 但 是 在 Python 3.x 中 它 就 是 一 个 
函数 了 。 不 过 ， 这 里 所 演示 的 还 是 Python 2.x。 


print 发 起 的 语句 ， 在 程序 中 主要 是 将 某 些 东西 打印 出 来 ， 还 记得 在 
字符 串 的 格式 化 输出 吗 ? 那 就 是 用 来 print 的 。 





>>> print "hello, world" 
hello, world 

>>> print "hello", "world" 
hello world 





请 仔细 观察 上 面 两 个 print 语 句 的 差别 。 第 一 个 打印 的 是 “hello， 
world”， 包 括 其 中 的 逗号 和 空格 ， 是 一 个 完整 的 字符 串 。 第 二 个 打印 的 
是 两 个 字符 串 ， 一 个 是 “hello”， 男 外 一 个 是 “world”， 两 个 字符 串 之 间 用 
过 号 分 隔 。 


本 来 ， 在 print 语 句 中 ， 字 符 串 后 面 会 接 一 个 mn 符号 ， 即 换行 。 但 
是 ， 如 果 要 在 一 个 字符 串 后 面 跟着 逗号 ， 那 么 换行 就 取消 了 ， 意 味 着 两 
个 字符 串 “hello” 和 “world” 打 印 在 同一 行 。 


或 许 现在 体现 得 还 不 是 很 明显 ， 换 一 个 方法 就 显示 出 来 了 。 〈 下 面 
用 到 了 一 个 称 为 for 循 环 的 语句 ， 后 面 要 详细 讲述 





>>> for i in [1,2,3,4,5]: 
print i 


ORONDP-: -: 





这 个 循环 的 意思 就 是 要 从 列表 中 依次 取出 每 个 元 素 ， 然 后 赋值 给 变 


量 i， 并 用 print 语 句 打 印 打 出 来 。 在 变量 i 后 面 没有 任何 符号 ， 每 打印 一 
个 就 换行 ， 再 打印 下 一 个 ， 这 就 古 那 个 ^\n”* 起 的 作用 。 


下 面 的 方式 就 跟 上 面 的 有 点 区 别 了 。 
>>> for i in [1,2,3,4,5]: 
i print 工 ， 
1 2 3 45 
在 Print 语句 的 最 后 加 了 一 个 运 号 ， 打 印 出 来 的 就 在 一 行 了 。 


print 语 句 经 常用 在 调试 程序 的 过 程 ， 让 我 们 能 够 知道 程序 在 执行 过 
程 中 产生 的 结果 。 


2.2.2 import 


曾经 用 到 过 一 个 Python 标准 库 math， 它 能 提供 很 多 数学 函数 ， 但 是 
这 些 函 数 不 是 Python 的 内 建 函 数 ， 而 是 属于 math 的 ， 所 以 ， 要 用 import 
math 来 引入 这 个 标准 库 。 


这 种 用 import 引 入 模块 (或 者 库 、 包 ) 的 方法 是 Python 编程 经 和 用 
到 的 。 引 用 方法 有 如 下 几 种 : 








>>> import math 
>>> math. pow(3,2) 
9.0 


这 是 常用 的 一 种 方式 ， 而 且 非 常 明确 ，math.pow (3，2) 就 明确 显 
示 了 ，pow0 函 数 是 math 模 块 里 的 。 可 以 说 这 是 一 种 可 读 性 非常 好 的 引 
用 方式 ， 并 且 不 同 模块 的 同名 函数 不 会 产生 冲突 。 

>>> from math import pow 


>>> pow(3,2) 
9.0 





这 种 方法 就 有 扣 偷 懒 了 ， 不 过 也 不 难 理解 ， 从 字面 意思 就 知道 
pow0 〇 函数 来 自 于 math 模 块 。 在 后 续 使 用 的 时 候 ， 只 需要 直接 使 用 pow() 
即 可 ， 不 需要 在 前 面 写 上 模块 名 称 了。 这 种 引用 方法 ， 比 较 适 合 于 引入 


筷 决 色 信 的 时 候 。 如 果 引 入 模块 多 了 ， 可 读 性 就 下 降 了 ， 会 不 知道 哪个 
函数 来 自 哪 个 模块 。 


>>> from math import pow as pingfang 
>>> pingfang(3,2) 
9.0 





这 是 在 前 面 基础 上 的 发 展 ， 把 从 某 个 模块 引入 的 函数 重新 命名 ， 比 
如 讲 pow 重 命名 为 pingfang， 然 后 使 用 pingfang() 束 相当 于 使 用 powO 了 。 


直到 要 引入 多 个 函数 的 情况 ， 可 以 这 样 做 : 


>>> from math import pow, e, pi 
>>> pow(e,pi) 
23.140692632779263 


引入 了 math 模 块 里 面 的 pow、e、pi，pow0 是 一 个 乘 方 函数 ，e 就 是 
欧 拉 数 ，Ppi 就 是 rr。 


e， 作 为 数学 常数 ， 是 自然 对 数 函 数 的 底数 。 有 时 称 它 为 欧 拉 数 
(Euler's number) ， 以 瑞士 数学 家 欧 拉 命 名 ; 是 纳 
皮尔 常数 ， 以 纪念 苏格兰 数学 家 约翰 : 纳 皮 尔 引 进 对 数 。 它 是 一 个 无 限 
不 循环 小 数 。e=2.71828182845904523536 〈《 维 基 百 科 》 


e 的 7 次 方 ， 是 一 个 数学 常数 ， 与 e 和 "一样 是 一 个 超越 数 。 这 个 第 数 
在 希 尔 伯 特 第 七 问题 中 曾 提 到 过 。 ( 《维基 百科 》) 





>>> from math import * 
>>> pow(3,2) 


9.0 
>>> sqrt(9) 
3.0 





这 种 引入 方式 是 最 管事 的 了 ， 一 下 将 math 中 的 所 有 消 数 部 引 过 来 
了 。“ 好 事 成 双 ” 往 往 都 是 梦想 ， 这 样 引入 模块 中 的 函数 ， 其 可 读 性 难免 
降低 了 ， 一 般 适 用 于 模块 中 的 函数 比较 少 的 时 候 ， 并 且 在 程序 中 应 用 比 
较 频 楷 的 情况 。 


以 上 用 math 模 块 为 例 ， 引 入 其 中 的 函数 ， 其 实在 编程 中 ， 各 样 的 对 
象 都 可 以 引入 。 


2.2.3 ”赋值 


大 家 对 于 赋值 语句 应 该 不 陌生 ， 在 前 面 已 经 频繁 使 用 了 ， 如 a=3 这 
样 的 ， 就 是 将 一 个 整数 赋 给 了 变量 。 


编程 中 的 “=” 和 数学 中 的 “= ?是 完全 不 同 的 。 在 编程 语言 中 , “=” 表 
示 赋 值 过 程 。 


除了 那 种 最 简单 的 赋值 之 外 ， 还 可 以 这 么 做 : 


>>> x, y, z = 1, "python", ["hello", "world"] 
>>> x 

1 

>>> y 

'python' 

>>> z 

['hello', 'world'] 


这 里 就 一 一 对 应 赋值 了 。 如 末 把 儿 个 值 赋 给 一 个 ， 可 以 吗 ? 


>>> a = "itdiffer.com", "python" 
>>> a 
('itdiffer.com', 'python') 


原来 是 将 右边 的 两 个 值 装 入 了 一 个 元 组 ， 然 后 将 元 组 赋 给 了 变量 
a。Python 太 聪明 了 。 


在 Python 的 赋值 语句 中 ， 还 有 更 聪明 的 。 
有 两 个 变量 ， 其 中 a=2，b=9。 现 在 想 让 这 两 个 变量 的 值 对 调 ， 即 最 


终 是 a=9，b=2。 





temp = a 
a = b; 
b = temp 





在 这 里 变量 束 如 同一 个 盒子 ， 值 就 如 同 放 到 盒子 里 面 的 东西 。 如 果 
要 实现 对 调 ， 必 须 再 找 一 个 例子， 将 a 盒子 里 面 的 东西 (数字 2〉 拿 到 那 
个 临时 盒子 (temp〉 中， 这 样 盒 子 束 空 了， 然后 将 b 盒 子 中 的 东西 〈 数 











字 9) 拿 到 a 盒 子 中 (a=b) ， 完 成 这 步 之 后 ，b 盒 子 是 空 的 了 ， 最 后 将 临 
时 盒子 里 面 的 那个 数字 2 拿 到 b 盒 子 中 。 这 就 实现 了 两 个 变量 值 的 对 调 。 


Python 只 要 一 行 就 完成 了 。 





>>> a, b=b, a 


>>> a 
9 
>>> b 
2 


a，b=b，a 就 实现 了 数值 对 调 ， 多 么 神 闸 。 之 所 以 神奇 ， 是 因为 前 
面 已 经 数 次 提 到 的 Python 中 变量 和 数据 对 象 的 关系 。 变 量 相当 于 贴 在 对 
0 这 个 操作 只 不 过 是 将 标签 换个 位 置 ， 束 分 别 指向 了 不 同 的 
数据 对 象 。 


还 有 一 种 赋值 方式 ， 被 称 为 " 链 式 赋值 。 





>>>m=n= "I use python" 
>>> print m, n 
I use python I use python 


用 这 种 方式 实现 了 一 次 性 对 两 个 变量 赋值 ， 并 且 值 相 同 。 


>>> id(m) 
3972659528L 
>>> id(n) 

3972659528L 


用 id0 来 检查 一 下 ， 发 现 两 个 变量 所 指 加 的 是 同一 个 对 象 。 

男 外 ， 还 有 一 种 判断 方法 ， 可 以 检查 两 个 变量 所 指 同 的 值 是 否 是 同 
a J 同一 个 和 相等 是 有 差别 的 。 在 编程 中 ， 同 一 个 就 是 id() 的 
结果 一 Fy 


>>> m is n 
True 





这 是 在 检查 m 和 n 分 别 指 辣 的 对 象 是 否 是 同一 个 ，True 说 明 是 同一 
个 
[se 


>>> a = "I use python" 
>>>b= a 

>>> a is b 

True 


这 跟 上 面 的 链 式 赋值 是 等 效 的 。 
但 是 : 


>>> b = "I use python" 
>>> a is b 

False 

>>> id(a 

3072659608L 

>>> id(b) 

3072659568L 


>>> a == b 
True 


人 
A 


还 有 一 种 赋值 形式 ， 如 果 从 数学 的 角度 看 是 不 可 思议 的 ， 如 
x=Xx+1， 在 数学 中 ， 这 个 等 式 是 不 成 立 的 ， 因 为 数学 中 的 “=” 是 等 于 的 含 
义 ， 但 是 在 编程 语言 中 成 立 ， 因 为 “=” 是 赋值 的 含义 ， 即 将 变量 x 增加 1 
之 后 ， 再 把 得 到 的 结果 赋 给 变量 x。 


这 种 变量 上 自己 变化 之 后 将 结果 再 赋值 给 目 己 的 形式 ， 称 为 “ 增 量 赋 
值 ”。+、-、*、/、% 都 可 以 实现 这 种 操作 。 


为 了 让 这 个 操作 写 起 来 省 点 事 儿 ， 可 以 写成 : x+=1， 如 








>>> x= 9 
>>> x += 1 
>>> Xx 

10 








除了 数字 ， 在 实际 中 字符 串 进 行 增 量 赋值 也 很 有 价值 。 


>>> m= "py" 
>>> m += "th" 
>>> m 
‘pyth' 


>>> m += "on" 
>>> m 


"python'， 


2.3 ”条件 语句 


条 件 ， 是 日 常生 活 中 经 常见 到 的 ， 比 如 你 给 某 个 公司 干 活 ， 条 件 是 
他 支付 薪水 。 所 以 ， 条 件 语句 ， 也 见 诸 各 种 高 级 编程 语言 。 


2.3.1 让 语 和 名 


站 语句 是 由 直 发 起 的 一 个 语句 ， 即 if 发 起 是 一 个 条 件 ， 在 满足 此 条 件 
后 执行 相应 的 内 容 。 寺 这 个 单词 就 是 构成 条 件 语 句 的 关键 词 。 


>>>a=8 
>>> if a==8: 
print a 


8 


在 交互 模式 下 ， 简 单 书 写 一 下 站 发 起 的 条 件 语句 。 特 别 说 明 ， 在 交 
互 模 式 中 写 稍微 长 一 点 的 程序 ， 本 里 不 值得 提倡 ， 此 处 只 是 为 了 演示 。 
如 果 你 要 写 大 段 的 代码 ， 干 万 不 要 在 交互 模式 下 写 。 


if a==8: 这 人 句 话 里 面 如 果 条 件 a==8 人 返回 的 是 True， 那 么 就 执行 下 面 的 
语句 。 此 语句 最 后 的 冒号 是 必需 的 ， 下 面 一 行 语 句 print a 要 有 四 个 空格 
的 缩 进 。 这 是 Python 的 特点 ， 称 之 为 语句 块 。 


唯 翁 说 得 不 严谨 ， 我 还 是 引用 维基 百科 中 的 叙述 : 


Python 开发 者 有 意 让 违反 了 缩 排 规则 的 程序 不 能 通过 编译 ， 以 此 来 
强迫 程序 员 养 成 民 好 的 编程 习惯 。 并 且 Python 语言 利用 缩 排 表 示 语 句 块 
的 开始 和 结束 (Off-side 规 则 〉， 而 非 使 用 花 括号 或 者 条 种 关键 词 。 增 
加 缩 排 表示 语句 块 的 开始 ， 而 减少 缩 排 则 表示 语句 块 的 结束 。 缩 排 成 为 
了 语法 的 一 部 分 ， 例 如 让 语句 。 


根据 PEP 的 规定 ， 必 须 使 用 四 个 空格 来 表示 每 级 缩 排 。 使 用 Tab 字 
































符 和 其 他 数目 的 空格 虽然 都 可 以 编译 通过 ， 但 不 符合 编码 规范 。 支 持 
Tab 字 符 和 其 他 数目 的 空格 仅仅 是 为 兼容 很 日 的 Python 程序 和 茶 些 有 问 
题 的 编辑 程序 。 


从 上 面 的 这 段 话 中 ， 提 炼 出 几 个 必需 的 要 求 : 
。 必须 要 通过 缩 进 方式 来 表示 语句 块 的 开始 和 结束 。 


I 
四 


2.3.2 if...elif...else 


a 在 进行 条 件 判 断 的 时 候 ， 只 有 if 往 往 是 不 够 的 。 看 如 图 2-1 所 示 的 流 
EG 






>10 


number number number 
more than 10 You are smart less than 10 


图 2-1 流程 









这 张 图 反映 的 是 这 样 一 个 问题 : 

输入 一 个 数字 ， 并 输出 输入 的 结果 。 如 果 这 个 数字 大 于 10， 那 么 输 
出 提示 大 于 10; 如 果 小 于 10， 则 输出 提示 小 于 10; 如 果 等 于 10， 就 输出 
表示 表扬 的 一 句 话 。 


从 图 中 焉 已 经 显示 出 来 了 ， 对 一 个 值 的 判断 结案 有 三 个 分 支 ， 为 了 
解决 多 分 文 的 问题 ， 束 引入 男 外 一 种 条 件 判断 :让 ...elif...else 语 人 句 。 


基本 样式 结构 : 





1: 
语句 块 
1 
elif 条 件 
2: 
语句 块 


2 
elif 条 件 


语句 块 


elif 用 于 多 个 条 件 时 ， 也 可 以 没有 。 那 就 回归 到 if 了 。 
下 面 就 不 在 交互 模式 中 写 代 码 了 。 打 开 你 的 编辑 器 ， 代 码 实例 如 
下 : 


#! /usr/bin/env python 
#coding:utf-8 


print "请 输入 任意 一 个 整数 数字 : 





泣 














number = int(raw_input()) # 通 


raw_input() 输 入 的 数字 是 字符 串 




















int() 将 该 字符 串 转 化 为 整数 





if number == 
print 输入 的 数字 字 是 : 


%d" % number 

print "You are SMART." 
elif number > 10: 

print "您 输入 的 数字 是 : 


%d" % number 

print "This number is more than 10." 
elif number < 10: 

print "您 输入 的 数字 是 : 


%d" % number 

print "This number is less than 10." 
else: 

print "Are you a human?" 


raw_input() 函 数 获 得 用 户 在 界面 上 输入 的 信息 ， 而 通过 它 得 到 的 虽 
0 但 它 是 字符 串 类 型 的 ， 所 以 要 转化 为 整数 型 ， 才 有 e 用 于 后 而 
比较 


上 述 程序 要 依据 条 件 进行 判断 ， 在 不 同 条 件 下 做 不 同 的 事情 。 需 要 
提醒 的 是 : 在 条 件 中 ，number==10， 为 了 阅读 方便 ， nb 
间 最 好 有 一 个 空格 ， 同 理 ， 后 面 也 有 一 个 。 这 里 的 10 是 int 类 型 ，number 
所 引用 的 对 象 也 是 int 类 型 。 


把 这 段 程 序 保存 成 一 个 扩展 名 是 .py 的 文件 ， 我 把 它 保存 为 
num.py， 进 入 到 存储 这 个 文件 的 目录 ， 运 行 python num.py， 吏 能 看 到 程 








序 执行 结果 了 。 下 面 是 我 执行 的 结果 ， 供 参考 。 


$ _ python num.py 
请 输入 任意 一 个 整数 数字 : 


12 
您 输入 的 数字 是 : 


12 
This number is more than 10. 


$ python num.py 
请 输入 任意 一 个 整数 数字 : 


10 
您 输入 的 数字 是 : 


10 
You are SMART. 


$ python num.py 
请 输入 任意 一 个 整数 数字 : 


9 
您 输入 的 数字 是 : 


9 
This number is less than 10. 


在 “条 件 ” 中 ， 就 是 前 面 已 经 提 到 的 各 种 条 件 运算 表达 式 ， 如 果 是 
True， 束 执行 该 条 件 下 的 语句 。 


2.3.3 ”三 元 操作 符 


RR 


>>> name = "qiwsir" if "laoqi" else "github" 
>>> name 

'qiwsir' 

>>> name = 'giwsir' if "" else "python" 


>>> name 
"python'， 
>>> name = "giwsir" if "github" else "" 
>>> name 
'qiwsir' 


总 结 一 下 : A=Y if X else Z 
结合 前 面 的 例子 ， 可 以 看 出 : 


。 如 宁 双 为 真 ， 那 么 就 执行 A=Y。 
。 如 果 X 为 假 ， 束 执行 A=Z。 


如 此 例 : 


>>> x 
>>> y 
>>> a 
>>> a 
'qiwsir' 

>>> b = "python" if x < y else "qiwsir" 
>>> b 


2 
8 
"python" if x > y else "qiwsir" 


'python' 


2.4 for 循环 








循环， 也 是 现实 生活 中 常见 的 现象 ， 我 们 常 说 的 日 复 一 日 就 是 典型 
的 循环 。 又 如 日 月 更 达 、 斗 转 星 移 ， 无 不 是 循环 ;王朝 更 迁 、 子 子 让 
孙 、 繁 衍 不 轧 ， 从 东 个 角度 看 也 都 是 循环 。 

编程 语言 束 是 要 解决 现实 问题 的 ， 因 此 也 少不了 要 循环 。 


在 Python 中 ， 循 环 之 一 : for 循 环 。 言 外 之 意 ， 还 有 别 的 循环 ， 请 读 
者 保持 阅读 的 耐心 ， 继 续 。 


For 循 环 的 基本 结构 是 : 


for 循环 规则 : 








操作 语句 





从 基本 结构 看 ， 其 有 者 同和 条 件 语句 类 似 的 地 方 ， 部 有 则 和 号 ; 语句 
块 都 要 缩 进 。 是 的 ， 这 些 是 不 可 或 缺 的 。 


2.4.1 简单 的 for 循 环 
前 面 介 绍 print 语 句 的 时 候 ， 出 现 了 一 个 简单 例子 : 
>>> hello = "world" 


>>> for i in hello: 
print i 


OP-oO.-.- 


这 个 for 循 环 是 怎么 工作 的 呢 ? 


。 hello 这 个 变量 引用 的 是 “world” 这 个 字符 串 类 型 的 数据 。 

。 变量 i 通过 “hello” 找 到 它 所 引用 的 对 象 “world”， 因 为 字符 串 类 型 的 
对 象 属 于 序列 类 型 ， 能 够 进行 索引 ， 于 是 就 按照 索引 顺序 ， 从 第 一 
字符 开始 ， 依 次 获得 该 字符 。 

。 当 i="w" 的 时 候 ， 执 行 print i， 打 印 出 了 字母 w， 结 束 之 后 循环 第 二 
次 ， 让 i="e"， 然 后 执行 print i， 打 印 出 字母 e。 如 此 循环 下 去 ， 一 直 
到 最 后 一 个 字符 被 打印 出 来 ， 循 环 自动 结束 。 注 意 ， 每 次 打印 之 后 
要 换行 。 


因为 也 可 以 通过 使 用 索引 《 偶 移 量 ) 得 到 序列 对 象 的 某 个 元 隶 ， 所 
以 ， 还 可 以 通过 下 面 的 循环 方式 实现 同样 的 效 末 : 











>>> for i in range(len(hello)): 
print hello[i] 


OPFPTO. ， 


其 工作 方式 是 : 


。 len (hello〉 得 到 hello 引 用 的 字符 串 的 长 度 ， 为 5。 

。range (len (hello) 就 是 range (5) ， 也 就 是 0，1，2，3，4]， 对 
应 着 “world” 每 个 字母 索引 ， 也 可 以 称 之 为 偏 移 量 。 这 里 应 用 了 一 
个 新 的 函数 range()， 关 于 它 的 用 法 ， 继 续 阅 读 束 能 看 到 了 。 

。foriinrange (len (hello) ) 就 相当 于 for iin[0，1，2，3，4]， 让 i 
依次 等 于 list 中 的 各 个 值 。 当 i=0 时 ， 打 印 hello[0]， 也 就 是 第 一 个 字 
符 。 然 后 顺序 循环 下 去 ， 直 到 最 后 一 个 i=4 为 止 。 


以 上 的 循环 举例 中 ， 显 示 了 对 字符 串 的 字符 依次 获取 ， 同 时 涉及 了 
列表 ， 再 看 下 面 对 列 表 的 循环 : 

















>>> ls_line 
['Hello', 'I am qiwsir', 'Welcome you', ''] 
>>> for word in ls_line: 

print word 


Hello 


I am qiwsir 
Welcome you 


>>> for i in range(len(1s_line)): 
print ls_line[i] 


Hello 
I am qiwsir 
Welcome you 


2.4.2 range (start, stop[, step]) 


range0O 是 个 内 建 函 数 ， 一 般 形 式 是 range (start，stop[，step]) 。 


要 研究 清楚 一 些 函 数 () 特 别 是 内 置 函 数 () 的 功能 ， 建 议 读者 首先 要 
Be 因为 在 Python 中 ， 名 称 不 是 随便 取 的 ， 是 代 
一 定 意义 的 。 


在 具体 实验 之 前 ， 还 是 按照 惯例 ， 摘 抄 一 段 官方 文档 的 原 话 ， 让 我 
们 能 够 深刻 理解 之 : 





This is a versatile function to create lists containing arithmetic 
progressions.It is most often used in for loops.The arguments must be plain 
integers.If the step argument is omitted, it defaults to 1.If the start argument 
is omitted, it defaults to 0.The full form returns a list of plain 
integers[start, start+step, start+2*step, ...].If step is positive, the last 
element is the largest start+i*step less than stop; 计 step is negative, the last 
element is the smallest start+i*step greater than stop.step must not be 
zero (or else ValueError is raised) . 


天 于 range() 函 数 注 意 以 下 几 点 : 


。 这 个 函数 可 以 创建 一 个 数字 元 素 组 成 的 列表 。 

。 这 个 函数 最 常用 于 for 循 环 。 

。 函数 的 参数 必须 是 整数 ， 默 认 从 0 开始 。 返 回 值 是 类 似 [start， 
starttstep，start+2*step，...] 的 列表 。 

。 step 默 认 值 是 1。 如 果 不 写 ， 就 是 按照 此 值 。 

。 如 果 step 是 正 数 ， 返 回 list 的 最 后 的 值 不 包含 stop 值 ， 即 start+istep 这 
个 值 小 于 stop; 如 果 step 是 负数 ，start+istep 的 值 大 于 stop。 





。 step 不 能 等 于 零 ， 如 果 等 于 零 ， 就 报错 。 
再 对 各 个 参数 给 予 详 细 解 释 。 

。 start: 开始 数值 ， 默 认为 0， 即 如 果 不 写 这 项 ， 就 是 认为 start=0。 

。 stop: 结束 的 数值 ， 必 须要 写 。 

。 step: 变化 的 步 长 ， 默 认 是 1， 即 若 不 写 则 认为 步 长 为 1， 坚 决 不 能 
为 0。 


实验 开始 ， 并 对 照 前 面 所 讲述 的 参数 含义 : 





>>> range(9) #stop=9， 别 的 都 没有 写 ， 含 义 就 是 


range(0, 9, 1) 
[0, 1, 2, 3, 4, 5, 6, 7, 8] # 从 





Od 


开始 ， 步 长 为 








1， 直 到 小 于 




















9 的 那个 数 


>>> range(0，9) 
[0，1，2，3，4，5，6，7，8] 
>>> range(0, 9, 1) 

[0, 1, 2, 3, 4, 5, 6, 7, 8] 








>>> range(1, 9) #Sstart=1 

[1, 2, 3, 4, 5, 6, 7, 8] 

>>> range(0, 9, 2) #Step=2, 每 个 元 素 等 于 
start+i*step 


[0, 2, 4, 6, 8] 


仅仅 解释 一 下 range (0，9，2) : 


。 如 果 是 从 0 开始 ， 步 长 为 1， 可 以 写成 range (9) 的 样子 ， 但 是 ， 如 
果 步 长 为 2， 写 成 range (9，2) 的 样子 ， 计 算 机 就 有 点 糊涂 了 ， 它 
会 认为 start=9，stop=2。 所 以 ， 在 步 长 不 为 1 的 时 候 ， 一 定 要 把 start 
的 值 也 写 上 。 

。 Start=0，step=2，Sstop=9。 返 回 的 列表 中 的 第 一 个 值 是 start=0， 第 二 











个 值 是 start+1*step=2 〈 注 意 ， 这 里 是 1， 不 是 2， 不 论 是 列表 还 是 字 
符 串 ， 索 引 值 都 是 从 0 开始 的 ) ， 第 n 个 值 就 是 start+ Cn-1) *step。 
直到 小 于 stop 前 的 那个 值 。 

熟悉 了 上 面 的 计算 过 程 ， 想 一 想 这 个 的 结果 是 什么 。 


>>> range(-9) 
期 望 返 回 [0， Sl -2， -3， -4， -D， -0， -7， -8] 能 实现 吗 ? 
分 析 一 下 ， 这 里 start=0，step=1，stop=-9。 


第 一 个 值 是 0;， 第 二 个 是 start+l*step， 将 上 面 的 数 代 入 应 该 是 1， 但 
是 最 后 是 -9， 显 然 出 现 问题 了 。 但 是 ，Python 在 这 里 不 报错 ， 它 返回 的 
结果 是 : 


>>> range(-9) 
>>> range(0，-9) 
>>> range(0) 
[] 
报错 和 返回 结果 是 两 个 含义 。 
返回 的 不 是 我 们 要 的 。 应 该 如 何 修改 呢 ? 





>>> range(0, -9, -1) 
[9, -1 -2, -3, -4, 攻 
>>> range(0，-9，-2) 
[9, -2， -4, -6, -8] 


5, -6, -7, -8] 


有 了 这 个 内 置 函数 ， 很 多 事情 就 简单 了 。 比 如 : 


>>> range(0, 100, 2) 
[0, 2, 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 40, 


100 以 内 的 自然 数 中 的 偶数 组 成 的 列表 残 非常 简单 地 搞定 了 上 面 那 


个 问题 。 


思考 一 个 问题 ， 现 在 有 一 个 列表 ， 比 如 是 


am", "learning", "it", "with", "qiw 


TT TAT 


["I", "am", "a", "pythoner", "I", 


ee 但 是 不 能 一 个 一 个 用 手指 头 来 


请 沉思 两 分 钟 之 后 ， 目 己 实 验 一 下 ， 然 后 看 下 面 。 


>>> pythoner 


['I', 'am', 'a', 'pythoner', 'I', 'am', 'learning', 'it', 'with', 'qiwsir'] 
>>> py_ index = = range(len(pythoner)) ## 以 

len(pythoner ) 为 

stop 的 值 


>>> py_index 
[9，1，2，3，4，5，6，7，8，9] 


再 用 手指 头 指 着 Pythoner 里 面 的 元 素数 一 数 ， 是 不 是 跟 结 果 一 样 ? 
例 : 找 出 100 以 内 的 能 够 被 3 整除 的 正 整 数 。 


分 析 : 这 个 问题 有 两 个 限制 条 件 ， 第 一 是 100 以 内 的 正 整数 ， 根 据 
前 面 押 学 ， i (1, 100) 第 二 个 是 要 解决 被 3 整除 的 
问题 ， 假 设 某 个 正 整数 n 能 够 被 3 整除 ， 也 就 是 n%3〈% 是 取 余 数 ) 为 0。 
那么 如 何 得 到 n 呢 ， 束 是 要 用 for 循 环 。 


以 上 做 了 简单 分 析 ， 要 实现 流程 ， 还 需要 细 化 一 下 。 按 照 前 面 曾经 
讲授 过 的 一 种 方法 ， 要 男 出 解决 问题 的 流程 图 ， 如 图 2-2 所 示 。 










aliquot = [] 





foriin range(1, 100) 


aliquot.append(n) 


print aliquot 





图 2-2 解决 问题 的 流程 图 
下 面 写 代码 就 是 “ 按 图 索 到 了 。 








#! /usr/bin/env python 
#coding:utf-8 


aliquot = [] 


for n in range(1, 100): 


if n % 3 == 0: 
aliquot.append(n) 


print aliquot 

代码 运行 结果 : 

[3, 6, 9, 12, 15, 18, 21, 24, 27, 30, 33, 36, 39, 42, 45, 48, 51, 54, 57, 60, 63, 6 
在 上 面 的 代码 中 ， 将 for 循 坏 和 if 条 件 判 断 都 用 上 了 。 

不 过 ， 感 觉 有 扣 儿 麻烦 ， 其 实 这 么 做 束 可 以 了 : 





>>> range(3,100,3) 
[3, 6, 9, 12, 15, 18, 21, 24, 27, 30, 33, 36, 39, 42, 45, 48, 51, 54, 57, 60, 6 


2.4.3 for 的 对 象 


所 有 的 序列 类 型 对 象 都 能 够 用 for 来 循环 。 比 如 : 


>>> name_str = "qiwsir" 
>>> for i in name_str: 
print i, 


qiwsir 


>>> name_list = list(name_str) 
>>> name_1list 
['q', 全 'W', ro “下 'r'] 
>>> for i in name_list: 

print i, 


qiwsir 


>>> name_set = set(name_str) #set 还 可 以 用 


>>> name_set 
set(['q', 二 本 "Ss rs 'w']) 
>>> for i In name_set: 
print i, 
qisrw 
>>> name_tuple = tuple(name_str) 
>>> name_tuple 
('g', “二 'W', "S| 'r') 
>>> for i in name_tuple: #tuple 也 能 呀 


print i, 


qiwsir 


>>> name_dict={"name": "qiwsir", "lang": 


>>> for i In name_dict: 


print i, "-->", name_dict[i] 


lang --> python 
website --> qiwsir.github.io 
name --> qiwsir 


"python", "website": "qiwsir.github.io"} 


#dict 也 不 例外 





用 for 循 环 读 取 字典 “ 键 / 值 ” 对 需要 多 说 儿 句 。 


有 这 样 一 个 字典 : 


>>> a_dict = {"name": "giwsir", "lang": 


获得 字典 键 、 值 的 函数 有 : 


"python", "email": "qiwsir@gmail.com", "web 


items/iteritems/keys/iterkeys/values/itervalues， 通 过 这 些 函 数 得 到 的 是 键 


或 者 值 的 列表 。 


>>> for k in a_dict(): 
print k, a_dict[k] 


lang python 

website www.itdiffer.com 
name qiwsir 

email qiwsir@gmail.com 


这 是 一 种 获得 字典 键 / 值 对 的 方法 ， 


满足 一 般 需 要 。 


>>> for k,v in a_dict.items(): 
print k, v 


lang python 
website www.itdiffer.com 


name qiwsir 
email qiwsir@gmail.com 


>>> for k,v in a dict,.iteritems(): 
print k, v 


lang python 


通 第 情况 下 较 党 用， 效率 也 能 


website www.itdiffer.com 
name qiwsir 
email qiwsir@gmail.com 


这 两 种 方法 也 能 够 实现 同样 的 效果 ， 特 别 是 第 二 个 iteritems(O) 效 率 挺 


到 


但 是 ， 要 注意 下 面 的 方法 : 





>>> for k in a dict.keys(): 
print k, a_dict[k] 

lang python 

website www.itdiffer.com 

name qiwsir 

email qiwsir@gmail.com 


. 这 种 方法 所 达到 的 效果 跟前 面 一 样 ， 但 不 太 提 倡 ， 因 为 效率 比较 
氏 。 


>>> for v in a dict.values(): 


print v 
python 
www.itdiffer.com 
diwsir 


diwsir@gmail.com 


>>> for v in a dict.itervalues(): 


print v 
python 
www.itdiffer.com 
diwsir 


diwsir@gmail.com 


单独 取 values， 推 荐 第 二 种 方法 。 


2.4.4 zip() 
前 面 了 解 了 “可 和 迭代 的 (iterable) ”这 个 词 ， 这 里 再 次 提 到 “迭代 ”， 
说 明 它 在 Python 中 占有 重要 的 位 置 。 


ee “Ak 的 表现 就 是 用 for 循 环 ， 从 序列 对 象 中 获得 一 定数 量 
J 元 系 。 








人 获得 列表 、 字 符 串 、 元 组 ， 旋 至 于 字典 的 键 / 值 对 都 是 


现实 中 迭代 不 是 都 那么 简单 的 ， 比 如 下 面 这 个 问题 。 


问题 ， 有 两 个 列表 ， 分 别 是 : a=[1，2，3，4，5]，b=[9，8，7， 
6，5]， 要 计算 这 两 个 列表 中 对 应 元 素 的 和 。 


解析 : 


经 观察 发 现 两 个 列表 的 长 度 一 样 ， 都 是 5。 那 么 对 应 元 素 求 和 ， 就 
是 相同 的 索引 值 对 应 的 元 素 求 和 ， 妈 a[i]+b[i] (i=0，1，2，3，4) ， 这 
样 一 个 一 个 地 束 把 相应 元 素 和 求 出 来 了 。 当 然 ， 要 用 for 来 做 这 个 事情 
了 . 








>>> for i in range(len(a)): 
c.append(a[i] + b[i]) 


>>> C 
[106, 10, 10, 10, 10] 


看 来 for 的 表现 还 不 错 。 


这 种 方法 虽然 解决 了 问题 ， 但 Python 总 不 会 局 限于 一 个 解决 之 道 。 
于 是 义 有 一 个 内 建 函 数 zip()， 可 以 让 同样 的 问题 有 不 一 样 的 解决 途径 


zip0 是 什么 东西 ? 在 交互 模式 下 用 help (zip〉， 得 到 官方 文档 是 : 


zip(...)zip(seq1l[,seq2[...]])-> [(seq1[0],seq2[0]...),(...)] 





Return a list of tuples,where each tuple contains the i-th element from 
each of the argument sequences.The returned list is truncated in length to the 
length of the shortest argument sequence. 


seql1、seq2 分 别 代 表 了 序列 类 型 的 数据 。 通 过 实验 来 理解 上 面 的 文 


>>> a = "giwsir" 
>>> b = "github" 


>>> zip(a,b) 
[9q9，9g) ii Ownwt) sh) iu) (Cr', b 


如 果 序 列 长 度 不 同 ， 那 么 就 以 “the length of the shortest argument 
seguence” 为 准 。 


>>> c = [1,2,3] 

>>> d = [9,8,7,6] 

>>> zip(c,d) 

[(1, 9), (2, 8), (3, 7)] 

>>> m 二 {"name", "lang"} 

>>> n = {"qiwsir","python"} 

>>> zip(m,n) 

[('lang', 'python'), ('name', 'giwsir"')] 


m、n 是 字典 吗 ? 当然 不 是 ， 下 面 的 才 是 字典 呢 。 


>>> s = {"name":"qiwsir"} 
>>> t = {"lang":"python"} 
>>> zip(s,t) 

[('name', 'lang')] 


zip(0) 是 一 个 内 置 函数 ， 它 的 参数 必须 是 某 种 序列 数据 类 型 ， 如 果 是 
和 
J 元 系 。 


下 面 是 比较 特殊 的 情况 ， 当 参数 是 一 个 序列 时 所 生成 的 结 








>>> a 
'qiwsir' 
>>> C 
[1，2，3] 
>>> zip(c) 


[(1,), (2,), (3,)] 


>>> zip(a) 


[( qi) (Cw,), (si), Ci,), Cr 


其 实 也 不 特殊 ， 因 为 只 提供 了 一 个 参数 ， 那 么 列表 中 的 元 组 就 一 个 
元 素 ， 此 时 元 组 中 元 素 后 面 要 有 一 个 逗号 《半角 的 ) 。 


很 好 的 zip01! 那么 束 用 它 来 解决 前 面 列表 中 值 对 应 相 加 问题 吧 。 





>>> d = [] 
>>> for x,y in zip(a,b): 
d.append(x + y) 


>>> d 
[10, 10, 10, 10, 10] 


比较 这 个 问题 的 两 种 解法 ， 似 乎 第 一 种 解法 适用 面 较 窄 ， 比 如 ， 如 
果 已 知 给 定 的 丙 个 列表 长 度 个 同 ， 那 么 第 一 种 解法 就 出 问题 了， 而 第 二 
种 能 法 还 可 以 继续 天 用， 的 确 如 此 ， 不 过 ， 第 一 种 解法 也 不 是 不 能 修订 


>>> a = [1,2,3,4,5] 
>>> b = ["python", "www.itdiffer.com","qiwsir"] 


如 果 已 知 是 这 样 两 个 列表 ， 要 将 对 应 的 元 素 “ 加 起 来 ”。 


>>> length = len(a) if len(a)<len(b) else len(b) 
>>> length 
3 


首先 用 这 种 方法 获得 两 个 列表 中 最 短 的 那个 列表 的 长 度 。 写 出 这 
句 ， 束 可 以 冒充 高 手 了 。 
>>> for i in range(length): 
a c.append(str(a[i]) + ":" + b[i]) 
>>> c 
['i:python', '2:www.itdiffer.com', '3:qiwsir'] 


我 还 是 用 第 一 个 思路 做 的 ， 经 过 这 么 修正 一 下 ， 也 还 能 用 。 要 注意 


一 个 细节 ， 在 “加 ”的 时 候 ， 不 能 直接 用 a[fij， 因 为 它 引 用 的 对 象 是 一 个 
int 类 型 ， 不 能 跟 后 面 的 str 类 型 相 加 ， 必 须 转 化 一 下 。 


当然 ，zip0 也 是 能 解决 这 个 问题 的 。 


>>> d = [] 
>>> for x,y in zip(a,b): 
d.append(x + y) 


Traceback (most recent call last): 


File "<stdin>", line 2, in <module> 
TypeError: unsupported operand type(s) for +: 'int' and 'str' 


报错 ! 看 错误 信息 ， 我 刚刚 提醒 的 那个 问题 就 冒 出 来 了 。 所 以 ， 应 
这 么 做 : 


>>> for x,y in zip(a,b): 


d.append(str(x) + ":" + y) 
>>> dd 
['1i:python', '2:www.itdiffer.com', '3:qiwsir'] 


这 才 得 到 了 正确 结 


切记 : Computer 是 一 个 姑娘 ， 她 非常 秀气 ， 需 要 敲 代 码 的 小 伙 子 们 
耐心 地 、 细 心地 跟 她 相处 。 


以 上 两 种 写法 哪个 更 好 呢 ? 





>>> result 

[(2, 11), (4, 13), (6, 15), (8, 17)] 
>>> zip(*result) 

[(2, 4, 6, 8), (11, 13, 15, 17)] 











zip() 还 能 这 么 干 ， 是 不 是 有 点 意思 ? 
下 面 延伸 一 个 问题 。 


问题 : 有 一 个 字典 yinfor= 
{"name":"giwsir"，"site":"qiwsir.github.io"，"]ang":"python"}， 这 个 字典 


变换 成 : infor= 


rol 


{"giwsir":"name", "giwsir.github.io":"site"”, "python":"lang"}。 
解析 : 


人 解法 有 儿 个 ， 如 果 用 for 循 环 ， 可 以 这 样 做 (当然 ， 方 法 不 限于 下 列 
He 8 


TT。TT 


>>> infor = {} 
>>> for k, v in myinfor ,Items( ) : 
infor[v]=k 
>>> infor 
{'python': 'lang', 'qiwsir.github.io': 'site', 'giwsir': 'name'} 


下 面 用 zip0) 来 试 试 : 


>>> dict(zip(myinfor.values(), myinfor.keys())) 
{'python': 'lang', 'qiwsir.github.io':; 'site', 'giwsir': 'name'} 


这 是 什么 情况 ? 原来 这 个 zip0 还 能 这 样 用 。 是 的 ， 本 质 上 有 是 这 么 回 
事 。 如 末 将 上 面 这 一 行 分 解 开 来 ， 束 明白 其 中 的 奥妙 了 。 





>>> myinfor .values() 

['python', ‘qiwsir', 'qiwsir.github.io'] 

>>> myinfor.keys() 

['lang', 'name', 'site'] 

>>> temp = zip(myinfor.values(),myinfor.keys()) 

>>> temp 

[('python', 'lang'), ('qiwsir', 'name'), ('qiwsir.github.io', 'site')] 


>>> dict(temp) 
{'python': 'lang', 'gqiwsir.github.io': 'site', 'gqiwsir': 'name'} 


人 征 不 是 明白 zipO0 和 循环 的 关系 了 呢 ? 有 了 它 可 以 让 茶 些 循环 
[可 人。 


2.4.5 enumerate() 


本 来 可 以 通过 fori in range (len 〈list) ) 的 方式 得 到 一 个 list 的 每 个 
元 素 索 引 ， 然 后 再 用 list 外 的 方式 得 到 该 元 素 。 如 果 要 同时 得 到 元 素 索 引 
和 元 素 怎 么 办 ? 可 以 这 样 : 








>>> for i in range(len(week)): 
3 print week[i]+' is '+str(i) 
monday is 0 
sunday is 1 
friday is 2 


注意 ，i 是 int 类 型 ， 如 果 和 前 面 的 用 + 连接 ， 必 须 是 str 类 型 。 
Python 中 提供 了 一 个 内 置 函数 enumerate， 能 够 实现 类 似 的 功能 。 


>>> for (i,day) in enumerate(week): 
print day+' is '+str(i) 

monday is 0 

sunday is 1 

friday is 2 





官方 文档 是 这 么 说 的 : 


Return an enumerate object.sequence must be a sequence, an iterator， 
or some other object which supports iteration.The nextOmethod of the 
iterator returned by enumerate()returns a tuple containing a count (from start 
which defaults to 0 ) and the values obtained from iterating over sequence: 


顺便 抄录 几 个 例子 ， 供 读者 欣 沉 ， 但 最 好 目 己 实验 一 下 。 








>>> seasons = ['Spring', 'Summer', 'Fall', 'Winter'] 

>>> list(enumerate(seasons)) 

[(0, 'Spring'), (1, 'Summer'), (2, 'Fall'), (3, 'Winter')] 
>>> list(enumerate(seasons, start=1)) 

[(1， 'Spring'), (2, 'Summer'), (3, 'Fall'), (4, 'Winter')] 


对 于 这 样 一 个 列表 : 


>>> mylist = ["qiwsir",703,"python"] 
>>> enumerate(mylist) 
<enumerate object at Oxb74a63c4> 





出 现 这 个 结果 ， 用 list 就 能 实现 转换 ， 显 示 内 容 意 味 着 可 达 代 。 


>>> list(enumerate(mylist)) 
[(0, 'qiwsir'), (1, 703), (2, 'python')] 


再 设计 一 个 小 问题 ， 练 习 一 下 这 个 函数 。 
问题 : 将 字符 串 中 的 荣 些 字符 符 换 为 其 他 的 字符 串 。 原 始 字符 串 
为 "Do you love Canglaoshi?Canglaoshi is a good teacher."， 请 


将 "Canglaoshi" 蔡 换 为 "PHP'"。 


解析 : 





>>> raw = "Do you love Canglaoshi? Canglaoshi is a good teacher." 


不 能 直接 对 这 个 字符 串 使 用 enumerate()， 因 为 它 会 变 成 这 样 : 


>>> list(enumerate(raw)) 
[(0, 'D'), (1, 0 )，(2， '), (3, 'y'), (4, '0'), (5, 'u'), (6, " '), (7, '1') 


这 不 是 所 需要 的 ， 所 以 ， 先 把 raw 转 化 为 列表 : 


>>> raw_ lst = raw.split(" ") 


然后 用 enumerate(): 


>>> for i, string in enumerate(raw_lst): 
if string == "Canglaoshi": 
raw_lst[i] = "PHP" 


没有 什么 异常 现象 ， 查 看 一 下 那个 raw_lst 列 表 ， 看 看 是 不 是 
把 "Canglaoshi" 蔡 换 为 "PHP" 了 。 


>>> raw_lst 
['Do', 'you', 'love', 'Canglaoshi?', 'PHP', 'is', 'a', 'good', 'teacher.'] 





只 蔡 换 了 一 个 ， 还 有 一 个 没有 蔡 换 ， 为 什么 ? 仔细 观察 发 现 ， 没 有 
蔡 换 的 那个 是 'Canglaoshi?'， 跟 条 件 判 断 中 的 "Canglaoshi" 不 一 样 。 


修改 一 下 ， 把 条 件 放宽 : 


>>> for i, string in enumerate(raw_ lst) : 
if "Canglaoshi" in string: 
raw_lst[i] = "PHP" 
>>> raw_lst 
['Do', 'you', 'love', 'PHP', 'PHP', 'is', 'a', 'good', 'teacher.'] 


然后 再 转化 为 字符 串 ， 留 给 读者 试 试 。 


2.4.6 ”列表 解析 


先 看 下 面 的 例子 ， 想 得 到 1 到 9 每 个 整数 的 平方 ， 并 且 将 结果 放 在 列 
表 中 打印 出 来 。 


>>> power2 = [] 

>>> for i in range(1, 10): 
power2.append(i*i) 

>>> power2 

[1, 4, 9, 16, 25, 36, 49, 64, 81] 





Python 有 一 个 非常 有 意思 的 功能 ， 就 是 list 解 机 ， 是 这 样 的 : 


>>> Squares = [x**2 for x in range(1,10)] 
>>> Squares 
[1, 4, 9, 16, 25, 36, 49, 64, 81] 


看 到 这 个 结果 还 不 惊叹 吗 ? 这 束 古 Python， 人 退 求 简洁 优雅 的 
Python ! 


其 官方 文档 中 有 这 样 一 段 描述 ， 道 出 了 list 解 析 的 真 详 : 





List comprehensions provide a concise way to create lists.Common 
applications are to make new lists where each element is the result of some 
operations applied to each member of another sequence or iterable, or to 
create a subsequence of those elements that satisfy a certain condition. 


这 就 是 Python 有 意思 的 地 方 ， 也 是 计算 机 高 级 语言 编程 有 意思 的 地 
， 你 只 要 动脑 筋 就 能 找到 惊喜 。 


请 在 平复 了 激动 的 心 之 后 ， 默 默 地 看 下 面 的 代码 ， 感 悟 一 下 list 解 
析 的 魅力 。 


>>> mybag = [' glass',' apple','green leaf ']  # 有 的 前 面 有 空格 ， 有 的 后 面 有 空格 





>>> [one.strip() for one in mybag] # 去 掉 元 素 前 后 的 空格 


['glass', 'apple', 'green leaf'] 


a 会 用 
| 。 


2.5 ” ”while 循环 


while， 翻 译 成 中 文 是 “ 当 ...... 的 时 候 ”， 这 个 单词 在 英语 中 常常 用 来 
作为 时 间 状 语 ，while...someone do somthing， 这 种 类 型 的 说 法 是 有 的 。 
在 Python 中 ， 它 也 有 这 个 含义 ， 区 别 是 “ 当 ...... 时 候 ” 这 个 条 件 成 立 在 一 
段 范 围 或 者 时 间 间 隔 内 ， 从 而 在 这 段 时 间 间 隔 内 让 Python 做 好 多 事情 。 
就 好 比 这 样 一 段 情景 : 


while 年 龄 大 于 





60 岁 ;: 
# 当 年 龄 大 于 


60 岁 的 时 候 


退休 


# 几 是 符合 上 述 条 件 就 执行 的 动作 


展开 想象 ， 如 果 制 作 一 道门 ， 这 道门 是 用 上 述 的 条 件 调控 开关 ， 假 
设 有 很 多 人 经 过 这 个 门 ， 只 要 年 龄 大 于 60 多 就 退休 〈 门 打开 ， 人 可 以 出 
去 ) ， 一 个 接 一 个 地 这 之 样 循 环 下 去 ， 突然 有 一 个 人 年 龄 是 50 岁 ， 那 么 这 
个 循环 在 这 里 就 仿 止 ， 即 不 满足 条 件 了 。 


这 就 是 while 循 环 。 写 一 个 严肃 点 儿 的 流程 ， 如 图 2-3 所 示 。 










图 2-3 while 循环 


2.5.1 猜 数 字 游 戏 


前 不 久 ， 有 一 个 在 校 的 大 学 生 朋 友 〈 李 航 ) 给 我 发 邮件 ， 让 我 看 了 
他 做 的 游戏 ， 这 款 游 戏 能 够 实现 多 次 猜 煞 ， 直 到 猜 中 为 止 。 这 是 一 个 多 
么 喜欢 学 习 的 大 学 生 呀 。 


现在 将 他 写 的 程序 恭 录 于 此 ， 这 一 举动 已 经 得 到 了 李 航 同学 在 QQ 
上 的 授权 ， 感 谢 他 对 本 书 的 支持 。 

















#! /usr/bin/env python 
#coding:UTF-8 


import random 


i=0 
while i < 4: 
Ga a Kh Gt 各 作风 人 汪 交 和 证 放 的 全 汪 全 的 生 和 衣 的 全 全 放 王 人 


num = ;input( ' 请 您 输入 








OO 




















') # 李 同学 用 的 是 





Python3 
xnum = random.randint(0, 9) 
x=3-1i 


If num == xnum: 
print ' 运 气 真 好 ， 您 猜 对 了 ! 























break 
elif num > xnum: 
print''' 您 猿 大 了 


1Nn 哈 哈 


;正确 答案 是 








:%s\n 您 还 有 








%s 次 机 会 ! 


''' %(xnum, x) 
elif num < xnum: 


print'' 您 猜 小 了 


INn 哈 哈 


, 正确 答案 是 


:%s\n 您 还 有 














%s 次 机 会 ! 
''' %(xnum, x) 
print 1 火炎 火炎 火炎 火炎 火炎 炎炎 炎炎 火炎 火炎 火炎 炎炎 炎炎 火炎 炎炎 炎炎 炎炎 1 


我 们 来 分 析 一 下 。 


首先 看 while i<4， 这 是 程序 中 为 猜测 限制 的 次 数 ， 最 多 是 三 次 ， 请 
注意 ， 在 while 循 环 体 中 的 最 后 一 句 : 计 =1， 这 是 说 每 次 循环 到 最 后 就 给 
i 增加 1， 当 bool (CI<4) 为 False 的 时 候 ， 就 不 再 循环 了 。 


当 bool (i<4) 为 True 的 时 候 ， 就 执行 循环 体内 的 语句 。 在 循环 体 
内 ， 让 用 户 输入 一 个 整数 ， 然 后 程序 随机 选择 一 个 整数 ， 最 后 判断 随机 
生成 的 数 和 用 户 输入 的 数 是 否 相等 ， 并 且 用 让 语句 判断 三 种 不 同 的 情 
况 。 


明白 了 上 述 代 码 ， 就 可 以 进一步 研究 是 否 可 以 优化 或 者 进行 其 他 修 
改 。 


为 了 让 用 户 的 体验 更 磷 ， 不 妨 把 输入 的 整数 范围 扩大 至 1 到 100 之 
间 。 











num_input = raw_input("please input one integer that is in 1 to 100:") 
我 用 的 是 Python 2.7， 在 输入 指令 上 区 别 于 李 同 学 。 


程序 用 num_input 变 量 接 收 了 输入 的 内 容 。 读 者 如 果 要 在 这 里 睡 
觉 ， 请 打 起 精神 ， 我 要 分 享 一 个 多 年 的 编程 经 验 。 


请 牢记 ， 任 何 用 户 输入 的 内 容 都 是 不 可 靠 的 。 


这 句 话 含义 深刻 ， 但 是 ， 这 里 不 做 过 多 的 解释 ， 需 要 各 位 在 随后 的 
编程 生涯 中 体验 。 根 据 此 经 验 ， 我 们 要 检验 用 户 输入 的 是 否 符合 我 们 的 
要 求 ， 我 们 要 求 用 户 输入 1 到 100 之 间 的 整数 ， 那 么 要 做 如 下 检验 : 

。 输入 的 是 否 是 整数 。 
。 如 果 是 整数 ， 是 人 否 在 1 到 100 之 间 。 


为 此 ， 要 做 : 
































if not num_input.isdigit() : #Sstr.isdigit() 是 用 来 判断 字符 串 是 否 纯粹 由 数字 组 成 














print "Please input interger." 
elif int(num_input)<0 and int(num_input)>=100 : 
print "The number Should be in 1 to 100." 


这 里 用 pass 的 意思 是 暂时 省 略 ， 如 采 满 足 了 前 面 提 出 的 要 求 ， 就 该 
执行 此 处 语句 。 


再 看 看 李 航 同学 的 程序 ， 在 循环 体内 产生 一 个 随机 的 数字 ， 这 样 用 
户 每 次 输入 ， 面 对 的 都 是 一 个 新 的 随机 数字 ， 这 使 得 猜 数 字 游 戏 难 度 太 
大 了 。 我 希望 程序 产生 一 个 数字 ， 直 到 猜 中 都 是 这 个 数字 。 所 以 ， 要 把 
产生 随机 数字 这 个 指令 移动 到 循环 之 前 。 











import random 


number = random.randint(1,100) 














while True: # 不 限制 用 户 的 次 数 了 








观察 李 同 学 的 程序 ， 还 有 一 点 需要 说 明 ， 那 就 是 在 条 件 表达 式 中 ， 
两 边 最 好 是 同 种 类 型 数据 ， 上 面 的 程序 中 有 num>xnum 样 式 的 条 件 表达 
式 ， 一 边 是 程序 生成 的 int 类 型 数据 ， 而 男 一 边 是 通过 输入 函数 得 到 的 str 
类 型 数据 。 在 某 些 情况 下 可 以 运行 ， 为 什么 ? 都 是 数字 的 时 候 是 可 以 
的 ， 但 是 这 样 不 好 。 


那么 ， 按 照 这 种 思路 ， 把 这 个 猜 数 字 程 序 重 写 一 下 : 














#!/UsSr/bin/env python 
#coding:utf-8 


import random 

number = random.randint(1,101) 
guess = 0 

while True : 


num_input = raw_input("please input one integer that is in 1 to 100:") 
guess += 1 


If not num_input.isdigit(): 
print "Please input interger." 

elif int(num_input) < 0 or int(num_input) >= 100: 
print "The number should be in 1 to 100." 


else: 
If number == int(num_input): 
print "OK, you are good.It is only %d, then you successed." % guess 
break 


elif number > int(num_input): 
print "your number is more less." 
elif number < int(num_input): 
print "your number is bigger." 
else: 
print "There is something bad, I will not work" 


以 上 仅 供 参考 ， 读 者 还 可 改进 。 


2.5.2 break 和 continue 





break 的 含义 就 是 要 在 这 个 地 方 中 断 循环 ， 跳 出 循环 体 。 下 面 这 个 
简要 的 例子 更 明显 : 


#!/UsSr/bin/env python 
#coding:utf-8 


a=8 
while a: 
if a % 2 == 0: 
break 
else: 
print "%d is odd number"%a 
a=0 


print "%d is even number"%a 


a=8 的 时 候 ， 执 行 循环 体 中 的 break 跳 出 循环 ， 执 行 最 后 的 打印 语 
人 句 ， 得 到 结果 : 


8 is even number 


如 果 a=9， 则 要 执行 else 里 面 的 print， 然 后 a=0， 循 环 就 再 执行 一 
次 ， 又 break 了 ， 得 到 结果 : 


9 is odd number 
0 is even number 


而 continue 则 是 要 从 当前 位 置 〈 即 continue 所 在 的 位 置 ) 跳 到 循环 体 
的 最 后 一 行 的 后 面 〈 不 执行 最 后 一 行 ) ， 对 一 个 循环 体 来 讲 ， 束 如 同 首 
尾 衔 接 一 样 ， 最 后 一 行 的 后 面 是 哪里 昵 ? 当然 是 开始 了 。 





#!/UsSr/bin/env python 
#coding:utf-8 




















a=9 
while a 
if a%2 == 0 
a -= 1 
continue # 如 果 是 偶数 ， 就 返回 循环 的 开始 
else: 





print "%d is odd number"%a  ”# 如 果 是 奇数 ， 就 打印 出 来 


a -= 1 


其 实 ， 对 于 这 两 个 条 件 ， 我 个 人 在 编程 中 很 少 用 到 ， 因 为 我 有 一 个 
固执 的 观念 ， 尽 量 将 条 件 在 循环 之 前 做 足 ， 不 要 在 循环 中 跳 来 跳 去 ， 
为 这 样 不 仅 可 读 性 下 降 了 ， 有 时 候 上 自己 也 容易 糊涂 。 


2.5.3 while...else 


while...else 有 点 类 似 于 许 ..else， 只 需要 一 个 例子 就 理解 了 ， 当 然 ， 
一 遇 到 else， 就 意味 着 已 经 不 在 while 循 环 内 了 。 


#!/UsSr/bin/env python 


count = 0 
while count < 5: 
print count, " is Jess than 5" 


count = count + 1 
else: 
print count, " is not less than 5" 


执行 结 


0 is less than 5 
1 is less than 5 
2 is less than 5 
3 is less than 5 
4 is less than 5 
5 is not less than 5 


2.5.4 for...else 


除了 有 while...else 外 ， 还 可 以 有 for...else， 这 个 循环 也 通常 用 于 跳出 
循环 之 后 要 做 的 事情 。 


#!/Uusr/bin/env python 
# coding=utf-8 


from math import sqrt 


for n in range(99, 1, -1): 
root = sqrt(n) 
if root == int(root): 
print n 
break 
else: 
print "Nothing." 


读者 是 合 能 够 读 懂 这 段 代 码 的 含义 ? 


阅读 代码 是 一 个 提升 自己 编程 水 平 的 好 方法 。 如 何 阅读 代码 ? 像 看 
网 上 新 闻 那 样 吗 ? 一 目 只 看 自己 喜欢 的 文字 ， 甚 至 标题 看 不 完 就 开始 


时? 

绝对 不 是 这 样 ， 阅 读 代 码 的 最 好 方法 是 给 代码 做 注释 。 对 ， 如 果 有 
可 能 就 给 每 行 代码 做 注释 ， 这 样 就 能 理解 代码 的 含义 了 。 

对 于 上 面 的 代码 ， 读 者 不 妨 做 注释 ， 看 看 它 到 底 在 干什么 。 把 for n 


in range (99，1，-1) 修改 为 for n in range (99，81，-1) 看 看 是 什么 结 
二 











2.6 文件 


文件 是 Computer 姑 女 非 常 重要 的 东西 ， 在 Python 里 ， 它 也 是 一 种 类 
型 的 对 象 ， 类 似 前 面 已 经 学 习 过 的 其 他 类 型 ， 包 括 文 本 的 、 图 片 的 、 音 
频 的、 视频 的 等 ， 还 有 不 少 没 见 过 的 扩展 名 的 。 事 实 上 ， 在 Linux 操 作 
系统 中 ， 所 有 的 东西 都 被 保存 到 文件 中 。 


先 在 交互 模式 下 碍 看 文件 都 有 哪些 属性 和 函数 : 


>>> dir(file) 
['_class ', '_ delattr ', '_doc ', '_ enter_ ', '_ exit ', '_ format _', 








这 里 只 对 部 分 属性 或 函数 进行 详细 说 明 ， 读 者 可 以 用 本 书 一 贯 倡导 
的 方法 自学 。 在 网 上 看 到 过 一 个 统计 ， 绝 大 多 数 程 序 员 都 是 自学 成 才 
中 
地 位 。 


特别 注意 观察 ， 在 上 面 有 __iter_ 这 个 东西 。 在 讲述 列表 的 时 候 它 
征 不 是 也 曾经 出 现 了 呢 ? 如 果 没 有 注意 看 ， 请 目 己 在 交互 模式 中 找 出 
来 。_iter “是 一 个 重要 的 标志 ， 它 意味 着 这 种 类 型 的 数据 是 可 和 迭 代 
的 。 接 下 来 ， 你 就 会 看 到 ， 可 友 代 的 是 多 么 神奇 。 





























2.6.1 打开 文件 


在 某 个 文件 夹 下面 建 立 了 一 个 文件 ， 名 为 : 130.txt， 并 且 在 里 面 输 
入 了 如 下 内 容 : 


learn python 
http://qiwsir.github.io 
diwsir@gmail.com 


bi 


下 图 显示 了 这 个 文件 的 存储 位 置 : 


qw@qw-Latitude-E4300:~/Documents/ITArtigheas/BasicPpython/codes$ ls 
EAN 

165-1.py 166-1.py 111-1.py 129-1.py \130.txt 

105 .py 109 .py 118-1.py 129-2.py yy 





qw@qw-Latitude-E43060:~/Documents/ITArticles/Basicpython/codes$ python 


我 在 当前 位 置 输入 了 python 〈 我 已 经 设置 了 环境 变量 ， 如 果 你 没有 
设置 ， 需 要 写 全 局 动 Python 命令 路 径 ) ， 进 入 到 交互 模式 。 在 交互 模式 
下 ， 这 样 操作 : 





>>> f = open("130.txt") # 打 开 已 经 存在 的 文件 

















>>> for line in f: 
print line 


learn python 
http://qiwsir.github.io 


diwsir@gmail.com 











将 打开 的 文件 赋值 给 变量 {， 这 样 就 是 变量 f 跟 对 象 文件 130.txt 用 线 
兴起 来 了 (对象 引 用 》， 本 质 上 下 前 面 所 讲 这 的 其 他 类型 数据 进行 且 值 
是 一 样 的 。 


接 下 来 ， 用 for 来 读 取 文件 中 的 内 容 ， 残 如 同 读 取 一 个 前 面 已 经 学 过 
的 序列 对 象 一 样 ， 如 列表 、 字 符 串 、 元 组 ， 将 读 到 的 文件 中 的 每 一 行 赋 
值 给 变量 line。 也 可 以 理解 为 ，for 循 环 是 一 行 一 行 地 读 取 文件 内 容 。 每 
次 扫描 一 行 ， 遇 到 行 结束 符号 m 表 示 本 行 结束 ， 然 后 是 下 一 行 。 


从 打印 的 结果 可 以 看 出 ， 打 印 的 每 一 行内 容 跟 文件 中 每 一 行 的 内 容 
是 一 样 的 ， 只 是 行 与 行 之 间 多 了 个 空 行 ， 前 面 显 示 文 章 内 容 的 时 候 ， 并 
没有 这 个 空 行 。 或 许 这 无 关 紧 要 ， 但是， 还 要 深究 一 下 才能 露 然 。 


在 原文 中 ， 每 行 结束 都 有 结束 符号 m， 表 示 换 行 。 在 for 语 名 汇总， 
print line 表 示 每 次 打印 完 line 的 对 象 之 后 就 换行 ， 也 就 是 打印 完 line 的 对 
象 之 后 会 增加 一 个 m。 这 样 看 来 ， 在 每 行 末 尾 就 有 两 个 n， 即 : mm， 于 
是 在 打印 中 就 出 现 了 一 个 空 行 。 






































>>> f = open('130.txt') 
>>> for line in f: 


print line, # 后 面 加 一 个 逗号 ， 就 去 掉 了 原来 默认 增加 的 


Nn 了 


learn python 
http://qiwsir.github.io 
diwsir@gmail.com 


在 进行 上 述 操作 的 时 候 ， 有 没有 遇 到 这 样 的 情况 呢 ? 


>>> f = open('130.txt ') 
>>> for line in f: 
print line, 


learn python 
http://qiwsir.github.io 
diwsir@gmail.com 












































>>> for line2 in f: # 在 前 面 通过 
for 循 环 读 取 了 文件 内 容 之 后 ， 再 次 读 取 
print Line2 # 然 后 打印 ， 却 没有 显示 任何 结果 








如 果 读 者 没有 过 到 上 面 的 问题 ， 可 以 试 试 。 


这 不 是 什么 错误 ， 是 因为 前 一 次 已 经 读 取 了 文件 内 容 ， 并 且 到 了 文 
件 的 末尾 了 。 再 重复 操作 ， 就 是 从 末尾 开始 继续 读 了 。 当 然 显示 不 了 什 
么 东西 ， 但 是 Python 并 不 认为 这 是 错误 ， 因 为 或 许 在 这 次 读 取 之 前 ， 已 
经 又 回 文 件 中 追加 内 容 了 。 那 么 ， 如 果 要 再 次 读 取 怎 么 办 ? 就 重新 来 一 
饥 好 了 。 这 就 好 比 有 一 个 指针 在 指 着 文件 中 的 每 一 行 ， 每 读 完 一 行 ， 指 
针 就 移动 一 行 。 下 到 指针 指名 了 文件 的 最 末尾 。 当 然 ， 也 有 办 法 把 指针 
移动 到 任何 位 置 。 


提醒 读者 注意 ， 因 为 当前 的 交互 模式 古 在 该 文件 所 在 目录 局 动 的 ， 
所 以 ， 就 相当 于 这 个 实验 室 和 文件 130.txt 是 同一 个 目录 ， 这 时 候 我 们 打 
开 文 件 130.txt， 就 认为 是 在 本 目录 中 打开 ， 如 采 文 件 不 是 在 本 目录 中 ， 























需要 写 清 楚 路 径 。 


比如 : 在 上 一 级 目录 中 (~/Documents/ITArticles/BasicPython) ， 假 
如 进入 到 那个 目录 ， 运 行 交 互 模式 ， 然 后 试图 打开 130.txt 文 件 。 








/Documents/ITArticles/BasicPpython/codess$ ls 
129-1.py 139.txt 
129-2.py 





/Documents/ITArticles/Basicpython/codes$ cd .. 
/Documents/ITArticles/BasicPython$ pytho 


>>> f = open("130.txt") 
Traceback (most recent call last): 
File "<stdin>", line 1, in <module> 
IOError: [Errno 2] No such file or directory: '130.txt'" 
>>> f = open("./codes/130.txt") # 必 须 得 写 上 路 径 了 


>>> for line in f: 
print line 


learn python 
http://qiwsir.github.io 
diwsir@gmail.com 


>>> 


2.6.2 ”创建 文件 





上 面 的 实验 中 ， 打 开 的 是 一 个 已 经 存在 的 文件 。 如 何 创建 一 个 新 文 
呢 ? 


>>> nf = open("131.txt", "w") 
>>> nf.write("This is a file") 





这 样 就 创建 了 一 个 文件 吗 ? 还 写 入 了 文件 内 容 吗 ? 


qw@qw-Latitude-E4300:~/Documents/ITArticles/BasicPpython/codes$ ls 
105-1.py 106-1.py 111-1.py 129-1.py -2369vtxt， 


105.py 199.py 118-1.py 129-2.py /131.txt/ 


qw@qw- La itude- E4300: ~/Documents/ITArtic[es7BasicPython/codesS cat 131,.txt 


This is a_ fileqw@qw -Latitude-E4300: 2]JDocunents/ITArttctes/Basicpython/codes$ 





从 上 图 中 可 以 看 到 ， 真 的 就 创建 了 者 文件， 并且 里 面 有 “This is a 
file” 那 句 话 。 


注意 ， 这 次 同样 是 用 open() 这 个 函数 ， 但 是 多 了 个 “w”， 这 是 在 告 
诉 Python 用 什么 样 的 模式 打开 文件 。 也 就 是 说 ， 用 open0 打 开 文 件 ， 可 
以 有 不 同 的 打开 模式 。 如 表 2-1 所 示 。 
表 2-1 打开 模式 


描 述 





以 读 方式 打开 文件 ， 可 读 取 文件 信息 
以 写 方式 打开 文件 ， 可 向 文件 写 入 信息 。 如 文件 存在 ， 则 清空 该 文件 ， 再 写 入 新 内 容 








以 追加 模式 打开 文件 (打开 文件 ， 文 件 指针 自动 移 到 文件 末尾 )， 如 果 文 件 不 存在 则 创建 
站 读 写 方式 打开 文件 ， 可 对 文件 进行 读 和 写 操作 








消除 文件 内 容 ， 然 后 以 读 写 方式 打开 文件 

以 读 写 方式 打开 文件 ， 并 把 文件 指针 移 到 文件 尾 

以 二 进 制 模式 打开 文件 ， 而 不 是 以 文本 模式 。 该 模式 只 对 Windows 或 DOS 有 效 ， 类 UNIX 的 文件 是 用 二 进 
制 模式 进行 操作 的 


























以 二 进 制 模式 打开 文件 ， 而 不 是 以 文本 模式 。 该 模式 只 对 Windows 
或 DOS 有 效 ， 类 UNIX 的 文件 是 用 二 进 制 模式 进行 操作 的 


从 表 2-1 中 不 难看 出 ， 在 不 同 模式 下 打开 文件 ， 可 以 进行 相关 的 读 
写 。 那 么 ， 如 果 什 么 模式 都 不 写 ， 像 前 面 那样 呢 ? 那样 就 默认 为 是 r 模 
式 ， 以 只 读 的 方式 打开 文件 。 


>>> f = open("130.txt") 

>>> f 

<open file '130.txt', mode 'r' at 0xb7530230> 
>>> f = open("130.txt","r") 

>>> ff 

<open file '130.txt', mode 'r' at 0xb750a700> 


可 以 用 这 种 方式 但 看 当前 打开 的 文件 是 采用 什么 模式 打开 的 ， 上 面 
显示 两 种 模式 是 一 样 的 效果 ， 如 果 不 写 那个 "r"， 残 默认 为 是 只 读 模 式 
了 。 下 面 逐 个 对 两 个 常用 模式 进行 解释 。 


1."w": 以 写 方式 打开 文件 ， 可 同文 件 写 入 信息 。 如 文件 存在 ， 则 





清空 该 文件 ， 再 写 入 新 内 容 


131.txt 这 个 文件 是 已 经 存在 的 ， 并 且 在 里 面 有 了 一 句 话 : Thisisa 
file。 


>>> fp = open("131.txt") 
>>> for line in fp: 
print line 


This is a file 

>>> fp = open("131.txt","w") 

>>> fp.write("My name is qiwsir.\nMy website is qiwsir.github.io") 
>>> fp.close() 





查看 文件 内 容 (cat 是 Linux 下 显示 文件 内 容 的 命令 ， 这 里 就 是 要 显 
示 131.txt 内 容 ) : 


$ cat 131.txt 
My name is qiwsir. 
My website is qiwsir.github.io 


2."a": 以 追加 模式 打开 文件 〈 即 一 打开 文件 ， 文 件 指针 自动 移 到 文 
件 末尾 ) ， 如 果 文 件 不 存在 则 创建 。 


>>> fp = open("131.txt","a") 
>>> fp.write("\nAha,I like program\n") # 向 文件 中 追加 





>>> fp.close() 


在 上 面 两 个 写 入 的 操作 之 后 ， 都 用 close0) 来 关闭 文件 ， 这 是 很 重要 
的 一 步 ， 一 定 要 养 成 一 个 习惯 ， 写 完 内 容 之 后 就 天 闭 。 


同样 ， 碍 看 文件 内 容 : 


$ cat 131.txt 

My name is qiwsir. 

My website is qiwsir.github.io 
Aha,I like program 





其 他 项 目 就 不 一 一 讲述 了 ， 该 者 可 以 上 自己 实验 。 


2.6.3 ”使 用 with 


在 对 文件 进行 写 入 操作 之 后 ， 一 定 要 牢记 一 件 事情 : file.close()， 
这 个 操作 干 万 不 要 起 记 ， 夺 在 记 了 那 就 补 上 ， 也 没有 什么 天 塌 地 隐 的 后 
果 。 


有 男 外 一 种 方法 能 够 不 用 这 么 让 人 揪心 ， 实 现 安全 地 关闭 文件 。 





>>> with open("130.txt","a") as f: 
f.write("\nThis is about 'with...as...'") 


>>> with open("130.txt","r") as f: 
5 print f.read() 


learn python 
http://qiwsir.github.io 
diwsir@gmail.com 

hello 


This is about 'with...as...’ 
>>> 


里 就 不 用 close() 了， 而 且 这 种 方法 更 有 Python 味 道 ， 或 者 说 更 符 
合 和 的 一 个 要 求 。 


2.6.4 文件 的 状态 


有 时 候 需 要 知道 一 个 文件 的 有 关 状 态 《〈 也 称 为 属性 ) ， 比 如 创建 日 
期 、 访 问 日 期 、 修 改 日 期 、 大 小 等 。 在 os 模块 中 ， 有 这 样 一 个 方法 ， 专 
门 让 我 们 查看 文件 的 这 些 状 态 参 数 。 


>>> import os 
>>> file_stat = os.stat("131.txt")  # 查 看 这 个 文件 的 状态 








>>> file_stat 
posix.stat_result(st_mode=33204, st_ino=5772566L, st_dev=2049L, st_nlink=1, st_ 





>>> file_stat.st_ctime # 这 是 文件 创建 时 间 


1407734600 .0882277 


这 是 什么 时 间 ? 看 不 懂 ! 别 着 急 ， 换 一 种 方式 。 在 Python 中 ， 有 一 
个 模块 tme， 是 专门 针对 时 间 设 计 的 。 


>>> import time 
>>> time.localtime(file stat.st_ctime) 
time.struct_time(tm year=2014, tm_ mon=8, tm_mday=11, tm_hour=13, tm_min=23, tm_ 


2.6.5 read/readline/readlines 


简单 的 读 取 文件 内 容 已 经 了 解 过 了 ， 但 是 ， 在 用 dir (file) 的 时 候 
会 看 到 三 个 函数 : read/readline/readlines， 它 们 各 自 有 什么 特点 ? 为 什么 
是 三 个 函数 ? 


在 读者 看 下 面 的 内 容 之 前 ， 请 想 一 想 ， 如 果 要 回答 这 个 问题 ， 你 要 
用 什么 方法 ? 注意 ， 我 问 的 是 用 什么 方法 能 够 找到 答案 ， 不 是 问答 案 内 
容 是 什么 。 因 为 内 容 肯 定 在 菜 个 地 方 存放 着 呢 ， 关 键 是 用 什么 方法 找 
到 。 


搜索 是 一 个 不 错 的 方法 。 
还 有 一 种 ， 束 是 在 交互 模式 下 使 用 的 ， 你 肯定 也 想到 了 。 


>>> help(file.read) 


用 这 样 的 方法 ， 可 以 分 别 得 到 三 个 函数 的 说 明 : 


read(...) 
read([size]) -> read at most size bytes, returned as a string. 
If the size argument is negative or omitted, read until EOF is reached. 
Notice that when in non-blocking mode, less data than what was requested 
may be returned, even if no size parameter was given. 

readline(...) 
readline([size]) -> next line from the file, as a string. 
Retain newline. A non-negative size argument limits the maximum 
number of bytes to return (an incomplete line may be returned then). 
Return an empty string at EOF. 

readlines(...) 
readlines([size]) -> list of strings, each a line from the file. 
Call readline() repeatedly and return a list of the lines so read. 
The optional size argument, if given, is an approximate bound on the 
total number of bytes in the lines returned. 





对 照 一 下 上 面 的 说 明 ， 三 者 的 异同 就 亚 现 了 。 


在 上 面 的 文档 中 有 EOF， 它 是 什么 意思 ? End-of-file。 在 维基 百科 
中 居然 有 对 它 的 解释 : 


In computing, End Of File (commonly abbreviated EOF[1]) isa 
condition in a computer operating system where no more data can be read 
from a data source.The data source is usually called a file or stream.In 
general, the EOF is either determined when the reader returns null as seen in 
Java's BufferedReader, [2]or sometimes people will manually insert an EOF 
character of their choosing to signal when the file has ended. 


明白 EOF 之 后 ， 来 对 比 一 下 。 


。 read: 如 果 指 定 了 参数 size， 就 按照 该 指定 长 度 从 文件 中 读 取 内 
容 ， 人 否则 ， 就 读 取 全 文 。 被 读 出 来 的 内 容 ， 全 部 塞 到 一 个 字符 串 里 
面 。 这 样 有 好 处 ， 就 是 东西 都 到 内 存 里 面 了 ， 随 时 取 用 ， 比 较 快 
捷 ; “成 也 外 何 败 也 肃 何 ”， 也 是 因为 这 一 点 ， 如 果 文 件 内 容 太 多 ， 
内 存 会 吃不消 的 。 文 档 中 已 经 提醒 注意 在 “non-blocking” 模 式 下 的 
问题 ， 关 于 这 个 问题 ， 不 是 本 节 的 重点 ， 暂 时 不 讨论 。 

。 readline: 那个 可 选 参 数 size 的 含义 同上 。 它 以 行为 单位 返回 字符 
串 ， 也 惑 是 每 次 读 一 行 ， 依 次 循环 ， 如 果 不 限 定 size， 直 到 最 后 一 
个 返回 的 是 空 字 符 串 ， 意 味 着 到 文件 末尾 了 (EOF) 。 

。 readlines: size 同 上 。 它 返回 的 是 以 行为 单位 的 列表 ， 即 相当 于 先 执 
行 readline()， 得 到 每 一 行 ， 然 后 把 这 一 行 的 字符 串 作 为 列表 中 的 元 
系 塞 到 一 个 列表 中 ， 最 后 将 此 列表 返回 。 


依次 演示 操作 ， 即 可 明了 。 有 这 样 一 个 文档 ， 名 为 : youmd， 其 内 
容 和 基本 格式 如 下 : 








You Raise Me Up 

When I am down and, oh my soul, so weary 

When troubles come and my heart burdened be ; 
Then, I am still and wait here in the silence, 
Until you come and sit awhile with me. 

You raise me up, so I can stand on mountains 
You raise me up, to walk on stormy seas; 

I am strong, when I am on your shoulders; 

You raise me up: To more than I can be. 


分 别 用 上 述 三 种 函数 读 取 这 个 文件 。 


>>> f = open("you.md") 
>>> content = f.read() 
>>> content 
"You Raise Me Up\nwhen I am down and, oh my soul, so weary; \nWhen troubles come 
>>> f.close() 


提示 : 养 成 一 个 好 习惯 ， 就 一 定 要 随手 关闭 不 用 的 文件 。 如 宁 不 
关闭 ， 它 还 驻 留 在 内 存 中 ， 后 面 义 没有 对 它 的 操作 ， 既 浪费 内 存 空间 ， 
也 增加 了 文件 安全 的 风险 。 


注意 : 在 Python 中 ，"\n' 表 示 换 行 ， 这 也 是 UNIX 系 统 中 的 规范 。 但 
是 ， 在 奇 昔 的 Windows 中 ， 用 '\rn' 表 示 换 行 。 不 过 ， 还 好 Python 在 处 理 
的 时 候 ， 会 自动 将 \rn' 转 换 为 \n'。 

请 仔细 观察 ， 得 到 的 是 一 个 大 大 的 字符 串 ， 但 是 这 个 字符 串 里 面包 
含 着 一 些 符号 m， 因 为 原文 中 有 换行 符 。 如 采用 print 和 输出 这 个 字符 串 ， 
就 是 这 样 的 ， 其 中 的 nm 起 作用 了 。 


# 建 议 读者 耐心 阅读 如 下 内 容 ， 并 到 网 上 搜索 这 前 歌 曲 听 一 听 。 

















>>> print content 

You Raise Me Up 

When I am down and, oh my soul, so weary; 

When troubles come and my heart burdened be; 
Then, I am still and wait here in the silence, 
Until you come and sit awhile with me. 

You raise me up, so I can stand on mountains 
You raise me up, to walk on Stormy seas; 

I am strong, when I am on your shoulders; 

You raise me up: To more than I can be. 


用 readline0O 读 取 ， 则 是 这 样 的 : 


>>> f = open("you.md") 

>>> f.readline() 

"You Raise Me Up\n' 

>>> f.readline() 

"When I am down and, oh my soul, so weary;\n' 
>>> f.readline() 

"When troubles come and my heart burdened be;\n' 
>>> f.close() 





显示 出 一 行 一 行 读 取 了 ， 每 操作 一 次 f.readline()， 束 读 取 一 行 ， 并 
且 将 指针 向 下 移动 一 行 ， 如 此 循环 。 显 然 ， 这 是 一 种 循环 ， 或 者 说 是 可 
友 代 的 。 因 此 ， 就 可 以 用 循环 语句 来 完成 对 全 文 的 读 取 。 





#!/UsSr/bin/env python 
# coding=utf-8 


f = open("you.md") 
while True : 


line = f.readline() 
if not line: # 到 | 





EOF， 返 回 空 字符 串 ， 则 终止 循环 








break 
print line ， # 注 意 后 面 的 逗号 
f.close() # 别 忘记 关闭 文件 


将 其 和 文件 "you.md" 保 存在 同一 个 目录 中 ， 我 这 里 命名 的 文件 名 是 
12701.py， 然 后 在 该 目录 中 运行 python 12701.py， 就 看 到 下 面 的 效果 
了 了 : 


~/Documents$ python 12701.py 

You Raise Me Up 

When I am down and, oh my soul, so weary; 

When troubles come and my heart burdened be; 
Then, I am still and wait here in the silence, 
Until you come and sit awhile with me. 

You raise me up, so I can stand on mountains 
You raise me up, to walk on Stormy seas,; 

I am strong, when I am on your shoulders; 

You raise me up: To more than I can be. 


也 用 readlines0) 来 读 取 此 文件 : 


>>> f = open("you.md") 
>>> content = f.readlines() 
>>> content 


[You Raise Me Up ,When I am down and,oh my soul,so 
weary;\n', When troubles come and my heart burdened be;\n',"Then,l am stil 
and wait here in the silence\n ,Until you come and sit awhile with 
me.n,You raise me up,so I can stand on mountains;\n',"Y ou raise me up,to 
walk on stormy seas;\n','l am strong, when Iam on your shoulders;\n',You 


raise me up:To more than I can be.\n'] 


返回 的 是 一 个 列表 ， 列 表 中 每 个 元 系 部 是 一 个 字符 
中 的 内 容 惑 是 文件 的 一 行文 字 ， 盒 行 末 的 符号 。 显 而 


for 来 循环 的 。 





早 ， 每 个 字符 串 





三 | 





>>> for line in content : 
print line ， 


You Raise Me Up 

When I am down and, oh my soul, so weary; 
When troubles come and my heart burdened be; 
Then, I am still and wait here in the silence, 
Until you come and sit awhile with me. 

You raise me up, so I can stand on mountains,; 
You raise me up, to walk on Stormy seas; 


I am strong, 


when I am on your shoulders,; 


You raise me up: To more than I can be. 


>>> f.,close() 


2.6.6 ” 读 很 大 的 文件 


2 


见 ， 它 是 可 以 用 


前 面 已 经 说 明了 ， 如 果 文 件 太 大 ， 就 不 能 用 read0) 或 者 readlines() 一 


O 


次 性 将 全 部 内 容 读 入 内 存 ， 可 以 使 用 while 循 环 和 readiin0 来 完成 这 个 任 


在 Python 中 ， 一 旦 遇 到 比较 特殊 的 、 为 手 的 问题 ， 往 往 有 好 的 工具 


岂 


>>> import fileinput 


>>> for line 


in fileinput.input("you.md"): 


print line ， 


You Raise Me 


Up 


When I am down and, oh my soul, so weary; 

When troubles come and my heart burdened be; 
Then, I am still and wait here in the silence, 
Until you come and sit awhile with me. 


You raise me 
You raise me 
I am strong, 
You raise me 


up, so I can stand on mountains,; 
up, to walk on stormy seas; 

when I am on your shoulders,; 

up: To more than I can be. 





我 比较 喜欢 它 ， 用 起 来 非常 得 心 应 手 ， 简 涪 明 快 ， 


在 对 付 很 大 的 文件 时 ， 就 有 一 个 模块 供 我 们 驱使 : 包 einput 模 


还 有 for。 


对 于 这 个 模块 的 更 多 内 容 ， 读 者 可 以 自己 在 交互 模式 下 利用 dir()、 
helpO 去 查看 明白 。 


诚然 ， 基 本 的 方法 也 不 是 不 能 用 的 。 


>>> for line in f: 
print line ， 


You Raise Me Up 

When I am down and，oh my soul, so weary 

When troubles come and my heart burdened be ; 
Then, I am still and wait here in the silence, 
Until you come and sit awhile with me. 

You raise me up, so I can stand on mountains 
You raise me up, to walk on Stormy seas; 

I am strong, when I am on your shoulders; 

You raise me up: To more than I can be. 


之 所 以 能 够 如 此 ， 是 因为 fle 是 可 迭代 的 数据 类 型 ， 直 接 用 for 来 实 
现 迭 代 过 程 。 


2.6.7 seek() 


这 个 函数 的 功能 就 是 让 指针 移动 。 比 如 : 


>>> f = open("you.md") 

>>> f.readline() 

'You Raise Me Up\n' 

>>> f.readline() 

"When I am down and, oh my soul, so weary;\n' 


现在 已 经 移动 到 第 四 行 末尾 了 ， 看 seek() 的 能 


>>> f.seek(0) 


意图 是 要 回 到 文件 的 最 开头 ， 那 么 如 果 用 freadline0) 应 该 读 取 第 一 


/一 


介 。 


>>> f.readline() 
"You Raise Me Up\n' 


果然 如 此 。 此 时 指针 所 在 的 位 置 还 可 以 用 tell0 来 显示 ， 如 : 


>>> f.tell() 
17L 


>>> f.seek(4) 


f.seek (4) 就 将 位 置 定位 到 从 开头 算 起 的 第 四 个 字符 后 面 ， 也 就 
是 "You" 之 后 、 字 母 "R" 之 前 的 位 置 。 





>>> f.tell() 
4L 


tell0 也 是 这 么 说 的 。 这 时 候 如 果 使 用 readline0， 束 是 从 当前 位 置 开 
始 到 行 末 。 


>>> f.readline() 
'Raise Me UPNn' 
>>> f.close() 


seek0) 还 有 别 的 参数 ， 具 体 如 下 : 
seek (...) seek (offset[, whence]l) ->None.Move to new file position. 


Argument offset is a byte count.Optional argument whence defaults to 
0 (offset from start of file, offset should be>=0) :other values are 1 (move 
relative to current position, positive or negative) , and 2 (move relative to 
end of file, usually negative, although many platforms allow seeking 
beyond the end of a file) .If the file is opened in text mode, only offsets 
returned by tell()are legal.Use of other offsets causes undefined 
behavior. Note that not all file objects are seekable. 


whence 的 值 : 


。 默认 值 是 9， 表示 从 文件 开头 开始 计算 指针 偏 移 的 量 〈 人 简称 仿 移 
量 ) 。 这 时 offset 必 须 是 大 于 等 于 0 的 整数 。 

。 是 1 时 ， 表 示 从 当前 位 置 开 始 计 算 偏 移 量 。offset 如 果 是 负数 ， 则 表 
示 从 当前 位 置身 前 移动 ， 整 数 表 示 同 后 移动 。 

。 是 2 时 ， 表 示 相 对 文件 末尾 移动 。 








2.7” 代 


跟 一 些 比 较 牛 的 程序 员 交 流 ， 经 和音 听 到 他 们 中 里 会 冒 出 不 标准 的 英 
文 单词 ， 而 知 loop 、iterate、traversal 和 recursion 不 在 其 内 ， 总 觉得 他 还 
不 够 牛 。 真 正 牛 的 程序 员 只 是 说 “循环 、 友 代 、 通 历 、 递 归 ”， 然 后 再 
pi ”。 那 么 大 神 程序 员 是 什么 样子 呢 ? 他 是 扫地 僧 ， 大 隐 
疙 于 市 。 


先 搞 清楚 这 些 名 词 : 


循环 (loop) ， 指 的 是 在 满足 条 件 的 情况 下 ， 重 复 执行 同一 段 代 
码 。 比 如 ，while 语 句 。 

欠 代 (iterate) ， 指 的 是 按照 某 种 顺序 逐个 访问 对 象 中 的 每 一 项 。 
比 W[ :for 计生 ]: 

递归 (recursion) ， 指 的 是 一 个 函数 不 断 调 用 目 身 的 行为 。 比 如 ， 
以 编程 方式 输出 著名 的 斐 波 纳 契 数列 。 

遍历 (traversal) ， 指 的 是 按照 一 定 的 规则 访问 树 形 结构 中 的 每 个 
节点 ， 而 且 每 个 节点 都 只 访问 一 次 。 








对 于 这 四 个 听 起 来 高 深 英 测 的 词汇 ， 其 实 前 面 已 经 涉及 了 一 个 一 一 
循环 (loop) ， 本 节 主 要 介绍 一 下 迭代 (iterate〉， 在 网 上 搜索 一 下 就 
会 发 现 ， 对 过 代 和 循环 、 北 归 进 行 比 较 的 文章 不 少 ， 分 别 从 不 同 角 度 将 
它们 进行 了 对 比 。 这 里 暂 不 比较 ， 先 搞 明 白 Python 中 的 迭代 。 


| 当然 ， 达 代 的 话题 会 很 长 ， 本 着 循 序 渐进 的 原则 ， 这 里 介绍 比较 初 
级 的 。 


儿 





2.7.1 潜 代 工具 





要 访问 对 象 中 的 每 个 元 素 ， 可 以 这 么 做 〈 例 如 一 个 list) : 


>>> lst 


口 
D 


['q', my 'W', 


qiwsir 


"Ss; i 'r'] 
>>> for i in lst: 
print i, 


除了 这 种 方法 ， 还 可 以 这 样 : 


TT5t 实 施 了 一 个 


iter() 


>>> lst_iter = iter(lst) 


>>> lst_iter.next() 


>>> lst_iter.next() 


>>> lst_iter.next() 


>>> lst_iter.next() 


>>> lst_iter.next() 


>>> lst_iter.next() 


>>> lst_iter.next() 
Traceback (most recent call last): 


File "<stdin>", 


StopIteration 


# 对 原来 的 











# 要 不 厌 其 烦 地 一 个 一 个 手动 访问 





line 1, in <module> 


iterO 是 一 个 内 建 函 数 。 


next() 束 是 要 获得 下 一 个 元 素 ， 但 是 作为 一 名 优 夯 的 程序 员 
不 能 这 样 一 个 一 个 地 敲 ， 于 是 : 


>>> while True: 


质 就 是 “ 懒 情 ”"， 当 然 





print lst_iter.next() 


Traceback (most recent call last): 


File "<stdin>", 


StopIteration 


line 2, in <module> 


先 不 管 错误 ， 再 来 一 过 。 


>>> lst_iter = 


iter(lst) 


# 报 错 ， 而 


















































# 错 误 暂 








日 搁 























漠 误 跟前 面 一 样 ， 什 么 原 








By 
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>>> while True 
print lst_iter.next() 























q # 果 然 自动 化 地 读 取 了 

工 

WwW 

s 

工 

Traceback (most recent call last): # 读 取 到 最 后 一 个 之 后 ， 报 错 ， 停 止 循环 





File "<stdin>", line 2, in <module> 
StopIteration 





首先 了 解 一 下 上 面 用 到 的 那个 内 置 函 数 ，iter()， 官 方 文档 中 有 这 样 
一 段 话 插 述 之 : 


iter (of, sentinel]) 


Return an iterator object.The first argument is interpreted very 
differently depending on the presence of the second argument.Without a 
second argument，o must be a collection object which supports the iteration 
protocol (the iterOmethod) , or it must support the sequence protocol (the 
getitem()method with integer arguments starting at 0) .If it does not support 
either of those protocols, TypeError is raised.If the second argument, 
sentinel, is given, then o must be a callable object.The iterator created in 
this case will call o with no arguments for each call to its next()method;if the 
value returned is equal to sentinel，StoplIteration will be raised, otherwise 
the value will be returned. 


提炼 一 下 此 上 段 主 要 的 东西 : 
。 返回 值 是 一 个 从 代 器 对 象 。 
。 人 参数 需要 是 一 个 符合 迭代 协议 的 对 象 或 者 是 一 个 序列 对 象 。 
。 next() 配 合 与 之 使 用 。 


我 们 常常 将 那些 能 够 用 诸如 循环 语句 之 类 的 方法 来 一 个 一 个 地 读 取 
元 素 的 对 象 ， 就 称 为 可 迭代 的 对 象 。 那 么 用 来 循环 的 〈 如 for) 就 称 为 迭 








人 开具 


用 严格 一 点 的 语言 说 : 所 谓 欠 代 工具 ， 就 是 能 够 按照 一 定 顺序 扫描 
迭代 对 象 的 每 个 元 素 〈 按 照 从 左 到 右 的 顺序 ) 。 


显然 ， 除 了 for 之 外 ， 还 有 别 的 迭代 工具 。 


那么 ， 刚 才 介 绍 的 iter0) 的 功能 呢 ?” 它 与 next() 配 合 使 用 ， 也 有 实现 
上 述 夫 代 工具 的 作用 。 


在 Python 中 ， 甚 至 在 其 他 的 语言 中 ， 关 于 迭代 的 说 法 比较 乱 ， 主 要 
是 名 词 乱 ， 刚 才 我 们 说 ， 那 些 能 够 实现 迭代 的 工具 ， 称 为 迭代 工具 ， 就 
是 这 些 迭 代 工 具 ， 不 少 程序 员 都 喜欢 叫 作 适 代 器 。 当 然 ， 这 都 是 汉语 翻 
详 ， 燃 语 残 是 iterator。 


从 例子 中 会 发 现 ， 如 果 用 for 来 迭代 ， 当 到 末尾 的 时 候 就 自动 结 
了 ， 不 会 报错 。 如 果 用 iter()...next0) 迭 代 ， 当 最 后 一 个 完成 之 后 不 会 自动 
结束 ， 还 要 继续 同 下 ， 但 是 后 面 没 有 元 素 了 ， 于 是 就 报 一 个 称 之 为 
Stoplteration 的 错误 (这 个 错误 的 名 字 叫 作 停 止 达 代 ， 这 哪里 是 报错 ， 
分 明 是 警告 ) 。 


读者 还 要 关注 iter(0...next0 迭 代 的 一 个 特点 。 当 运 代 对 象 lst_iter 被 迭 
代 结 束 ， 即 每 个 元 素 都 恋 取 了 一 过 之后， 指针 就 移动 到 了 最 后 一 个 元 素 
的 后 面 。 如 果 再 访问 ， 指 针 并 没有 自动 返回 到 首位 置 ， 而 是 仍然 停留 在 
末 人 位置， 所 以 报 StopIteration， 想 要 再 开始 ， 束 需要 重新 载 入 迭代 对 
象 。 所 以 ， 当 我 在 上 面 重新 进行 迭代 对 象 赋值 之 后 ， 又 可 以 继续 了 。 这 
种 情况 在 for 等 类 型 的 迭代 工具 中 是 没有 的 。 























2.7.2 ”文件 欠 代 需 


有 一 个 文件 ， 名 称 是 208.txt， 其 内 容 如 下 : 


Learn python with qiwsir. 
There is free python course. 
The website is: 
http://qiwsir.github.io 

Its language is Chinese. 


用 友 代 喜来 操作 这 个 文件 : 


>>> f = open("208.txt") 
>>> f.readline() # 读 第 一 行 





"Learn python with qiwsir,Nn' 
>>> f.readline() # 读 第 二 行 





"There is free python course.\n' 
>>> f.readline() # 读 第 三 行 





"The website Is:Nn' 








>>> f.readline() # 读 第 四 行 
"http:V/dqiwsir,github.ioNn' 
>>> f.readline() # 读 第 五 行 ， 也 就 是 最 后 一 行 














"Its language is Chinese.\n' 
>>> f.readline() # 无 内 容 了 ， 但 是 不 报错 ， 返 回 空 


以 上 演示 的 是 用 readline0 一 行 一 行 地 读 。 当 然 ， 在 实际 操作 中 ， 我 
们 是 绝对 不 能 这 样 做 的 ， 一 定 要 让 它 自动 进行 ， 比 较 常 用 的 方法 是 : 





>>> for line in f: 
print line, 


这 上 段 代码 之 所 没有 打印 出 东西 来 ， 是 因为 经 过 前 面 的 迭代 ， 指 针 已 
经 移 到 了 最 后 。 这 束 是 迭代 的 一 个 特点 ， 要 小 心 指 针 的 位 置 。 











>>> f = open("208.txt") # 从 头 再 来 











>>> for line in f: 
print line, 


Learn python with qiwsir. 
There is free python course. 
The website is: 
http://qiwsir.github.io 


Its language is Chinese. 





这 种 方法 是 读 取 文件 常用 的 。 另 外 一 个 readlinesO 也 可 以 。 但 是 ， 
需要 小 心 操作 。 


上 面 过 程 用 next0 也 能 够 实现 。 


>>> f = open("208.txt") 

>>> f.next() 

'Learn python with qiwsir.\n' 

>>> f.next() 

'There is free python course.\n' 

>>> f.next() 

'The website is:\n' 

>>> f.next() 

'http://qiwsir .github.io\n' 

>>> f.next() 

'Its language is Chinese.\n' 

>>> f.next() 

Traceback (most recent call last): 
File "<stdin>", line 1, in <module> 

StopIteration 








如 有 果 用 next()， 就 可 以 直接 读 取 每 行 的 内 容 ， 这 说 明文 件 是 天 然 的 
可 迭代 对 象 ， 不 需要 用 iter0 转 换 。 


再 有 ， 我 们 用 for 来 实现 欠 代 ， 在 本 质 上 就 是 目 动 调用 next0)， 只 不 
过 这 个 工作 已经 让 for 偷 偷 地 将 我 们 干 了 ， 到 这 里 应 该 给 for 取 邦 外 一 个 
名 字 : 雷锋 。 


列表 解析 也 能 够 作为 欠 代 工具 ， 在 研究 列表 的 时 候 ， 想 必 已 经 清楚 
了 。 那 么 对 文件 ， 是 否 可 以 用 ? 试 一 试 : 





>>> [ line for line in open('208.txt') ] 
['Learn python with qiwsir.\n', 'There is free python course.\n', 'The website 





至 此 ， 看 官 难 道 还 不 为 列表 解析 的 强大 魅力 所 折服 吗 ? 真 的 很 强 


其 实 ， 迭 代 需 远 远 不 止 上 述 这 么 简单 ， 下 面 我 们 随便 列举 一 些 ， 在 
Python 中 还 可 以 这 样 得 到 迭代 对 象 中 的 元 妹 。 
>>> list(open('208.txt')) 


['Learn python with qiwsir.\n', 'There is free python course.\n', 'The website 
>>> tuple(open('208.txt')) 


('Learn python with qiwsir.\n', 'There is free python course.\n', 'The website 
>>> "$$$".join(open('208.txt')) 
"Learn python with qiwsir.\n$$$There is free python course.\n$$$The website is: 
>>> a,b,c,d,e = open("208.txt") 
>>> a 
'Learn python with qiwsir.\n' 
>>> b 
'There is free python course.\n' 
>>> C 
"The website is:\n' 
>>> d 
'http://qiwsir .github.io\n' 
>>> e 
'Its language is Chinese.\n' 





述 方式 在 编程 实践 中 不 一 定 用 得 上 ， 只 是 秀一 下 可 以 这 么 做 ， 但 
不 是 非 要 这 么 做 。 


否 可 迭代 ? 可 以 。 读 者 不 妨 自己 仿照 前 面 的 方法 摸索 一 下 
过 了 ， 这 次 请 用 iter(0)...nextO 手 动 一 步 一 步 迭 
介 


往生- 


第 3 草本 数 


对 于 人 类 来 讲 ， 函 数 能 够 发 展 到 这 个 数学 思维 层次 是 一 个 飞跃 。 可 
以 说 ， 函 数 的 提出 直接 加 快 了 现代 科技 和 社会 的 发 展 ， 现 代 的 任何 科技 
门类 ， 乃 至 经 济 学 、 政 治学 、 社 会 学 等 ， 都 已 经 普 壳 使 用 函数 。 


下 面 一 段 十 来 自 维基 百科 关于 函数 的 词 条 。 


函数 这 个 数学 名 词 是 莱 布 尼 兹 在 1694 年 开始 使 用 的 ， 以 描述 曲线 的 
一 个 相关 量 ， 如 曲线 的 斜率 或 者 曲线 上 的 茶 一 点 。 茉 布 尼 效 所 指 的 函数 
现在 被 称 作 可 导 图 数 ， 数 学 家 之 外 的 普通 人 一 般 接 触 到 的 函数 即 属 此 
类 。 对 于 可 导 函 数 可 以 讨论 它 的 极限 和 导数 。 此 两 者 描述 了 函数 输出 值 
的 变化 同 输入 值 变化 的 关系 ， 古 微 积分 学 的 基础 。 


中 文 的 “函数 ”一 词 由 清朝 数学 家 他 善 兰 译 出 。 其 《代数 学 》 书 中 解 
释 :“ 凡 此 变量 中 函 (包含 ) 彼 变 量 者 ， 则 此 为 彼 之 函数 ”。 


函数 ， 从 简单 到 复杂 ， 各 式 各 样 。 但 不 管 什 么 样子 的 函数 ， 都 可 以 
用 图 3-1 概 括 。 


下 面 说 明 Python 中 的 函数 和 相关 问题 。 





























INPUT 


FUNCTION 
f: 


OUTPUT 
f(x) 


图 3-1 函数 


3.1 理解 函数 


在 中 学 数学 中 ， 可 以 用 这 样 的 方式 定义 函数 : y=4x+3， 这 就 是 一 个 
一 次 函数 ， 当 然 ， 也 可 以 写成 : f(x〉 =4x+3。 其 中 x 是 变量 ， 它 可 以 代 
表 任何 数 。 

当 x=2 时 ， 代 入 到 上 面 的 函数 表达 式 : 


f (2) =4*2+3=11 








所 以 ， fC2) =11 

但 是 ， 这 并 不 是 函数 的 全 部 ， 其 实在 函数 中 ， 并 没有 规定 变量 只 能 
是 一 个 数 ; 它 可 以 是 馒头 、 还 可 以 是 苹果 ， 不 知道 读者 是 否 对 函数 有 这 
个 层次 的 理解 ， 继 续 阅 读 会 理解 更 深刻 。 





3.1.1 变量 不 仅仅 是 数 


变量 x 只 能 是 任意 数 吗 ? 其 实 ， 一 个 函数 ， 就 是 一 个 对 应 关系 。 读 
者 尝试 着 将 上 面 表达 式 的 x 理解 为 馅 饼 ，4x+3， 束 是 4 个 馅 饼 加 上 3 (一 
般 来 讲 ， 单 位 是 统一 的 ， 但 你 非 让 它 不 统一 也 无 妨 ) ， 这 个 结果 对 应 着 
另外 一 个 东西 ， 那 个 东西 比如 说 是 iPhone。 或 者 说 可 以 理解 为 4 个 馅 饼 
加 3 束 对 应 一 个 iPhone， 这 就 是 所 谓 的 映射 关系 。 


所 以 ，x 不 仅仅 是 数 ， 还 可 以 是 你 认为 的 任何 东西 。 


变量 本 质 上 是 占 位 符 


函数 中 为 什么 变量 用 x? 这 是 一 个 有 趣 的 问题 ， 自 己 搜索 一 下 ， 看 
能 不 能 找到 答案 。 





我 也 不 清楚 原因 。 不 过 ， 我 清楚 地 知道 ， 变 量 可 以 用 x， 也 可 以 用 
别 的 符号 ， 甚 至 用 alpha、beta 这 样 的 字母 组 合 也 可 以 。 


变量 在 本 质 上 束 是 一 个 占 位 符 ， 这 是 一 针 见 血 的 理解 。 什 么 是 占 位 
符 ? 就 是 先 把 那个 位 置 用 变量 占 上 ， 表 示 这 里 有 一 个 东西 ， 至 于 这 个 位 
置 放 什么 东西 ， 以 后 再 将， 反正 先 用 一 个 符号 占 着 这 个 位 置 “ 占 位 
符 ) 。 


其 实在 高 级 语言 编程 中 ， 变 量 比 我 们 在 初中 数学 中 学 习 的 要 复杂 。 
但 是 ， 先 不 管 那些 ， 现 在 ， 就 按照 初中 数学 的 难 肛 来 研究 Python 中 的 变 
量 。 














在 Python 中 ， 通 常用 小 写字 母 来 命名 变量 ， 也 可 以 在 其 中 加 上 下 男 
线 ， 以 表示 区 别 。 


3.1.2 ”建立 简单 函数 


>>>a=2 
>>> y=3*a+2 
>>> y 

8 





这 种 方式 建立 的 函数 ， 与 在 初中 数学 中 学 习 的 没有 什么 区 别 。 当 
然 ， 这 种 方式 的 函数 在 编程 实践 中 没什么 用 途 ， 仅 仅 在 这 里 冒 出 来 ， 后 
面 绝对 不 用 这 个 形式 了 。 


输入 a=3， 然 后 输入 y， 看 看 得 到 什么 结果 呢 ? 








>>> a=2 
>>> y=3*a+2 
>>> y 


>>> a=3 
>>> y 





是 不 是 很 奇怪 ? 已 经 让 a 等 于 3 了 ， 为 什么 结果 y 还 是 8? 


还 记得 前 面 已 经 学 习 过 的 关于 “变量 赋值 ”的 原理 吗 ? a=2 的 含义 是 
将 2 这 个 对 象 贴 上 了 变量 a 的 标签， 经 过 计算 ， 得 到 了 8， 之 后 变量 y 引 用 





了 对 象 8。 当 变量 a 引 用 的 对 象 修改 为 3 的 时 候 ， 但 是 y 引 用 的 对 象 还 没有 
变 ， 所 以 还 是 8。 再 计算 一 次 ，y 的 连接 对 象 就 变 卫 : 


>>> a=3 

>>> y 

8 

>>> y=3*a+2 
>>> y 

11 


特别 注意 ， 如 果 没 有 预先 令 a=2， 直 接 写 函数 表达 式 则 会 报错 。 


>>> y=3*a+2 

Traceback (most recent call last): 
File "<stdin>", line 1, in <module> 

NameError: name 'a' is not defined 





注意 看 错误 提示 ，a 是 一 个 变量 ， 提 示 中 告诉 我 们 这 个 变量 没有 定 
义 。 显然， 如 果 函数 中 要 使 用 某 个 变量 ， 不 得 不 提前 定义 出 来 ， 定 义 方 
法 就 是 给 这 个 变量 赋值 。 


3.1.3 ”建立 实用 的 函数 





上 面 用 命令 方式 建立 函数 还 不 够 “正规 化 ”"， 那 么 就 来 写 一 个 .py 文件 
吧 。 


例如 ， 下 面 的 代码 : 


#!/UsSr/bin/env python 
#coding:utf-8 


def add function(a, b): 
c=a+b 
print c 


if name == "” main " 
add_function(2, 3) 











0 
字 。 


然后 就 进入 到 那个 文件 夹 ， 运 行 这 个 文件 ， 出 现下 面 的 结果 : 





qwGqw-Latitude-E43606:~/Documents/ITArticLes/BasicPython/codes95 ls 

105-1.py 105.py 166-1.py 
qw@qw-Latitude-E43060:~/Documents/ITArticles/Basicpython/codes$ python 1606-1.py 
5 





qw@qw-Latitude-E4360:~/Documents/ITArticles/Basicpython/codess$ 


你 运行 的 结果 是 什么 ”如果 没 有 得 到 上 面 的 结果 ， 就 要 非常 认真 地 


检查 代码 ， 注 意 ， 冒 号 和 空格 都 得 一 样 ， 因 为 冒 志 和 空格 也 很 重要 。 


下 面 开始 应 丁 解 牛 。 


def add_function (a，b) : 这 是 函数 的 开始 。 在 声明 要 建立 一 个 孔 
数 的 时 候 ， 一 定 要 使 用 def (def 束 是 英文 define 的 前 三 个 字母 ) ， 意 
思 就 是 告知 计算 机 ， 这 里 要 声明 一 个 函数 ，add_function 是 这 个 水 

数 名 称 ， 取 名 字 是 有 讲究 的 ， 束 好 比 你 的 名 字 一 样 。 在 Python 中 取 
名 字 的 讲究 就 是 要 有 一 定 意义 ， 能 够 从 名 字 中 看 出 这 个 函数 是 用 来 
干什么 的 。 从 add_function 这 个 名 字 中 ， 可 以 看 出 它 是 用 来 计算 加 

法 的 《严格 地 说 是 把 两 个 对 象 “ 相 加 ” 这 里 相 加 的 含义 是 比较 宽泛 
的 ， 包 括 对 字符 串 等 相 加 ) 。 (a，b) 这 个 括号 里 面 的 是 这 个 函数 
的 参数 ， 也 就 是 函数 变量 。 冒 号 非常 非常 重要 ， 如 果 少 了 ， 职 会 报 
错 。 冒 号 的 意思 就 是 下 面 开 始 真 正 的 函数 内 容 了 。 

c=a+b: 这 一 行 比 上 一 行 要 缩 进 四 个 空格 。 这 是 Python 的 规定 ， 要 

牢记 ， 不 可 丢掉 ， 和 于 了 就 报错 。 然 后 这 人 句 话 就 是 将 两 个 参数 相 加 ， 

结果 赋值 与 另外 一 个 变量 c。 

还 是 提醒 注意 ， 缩 进 四 个 空格 。 将 得 到 的 结果 c 的 值 打印 出 
if_name ==" main _": 这 人 句 话 先 照抄 ， 不 解释 (后 面 会 做 解释 
的 ) 。 注 意 的 地 方 就 是 不 缩 进 了 。 

add_function (2，3) : 这 才 是 真正 调用 前 面 建立 的 函数 ， 并 且 传 

入 两 个 参数 : a=2，b=3。 仔 细 观 察 传 入 参数 的 方法 ， 就 是 把 2 放 在 a 
那个 位 置 ，3 放 在 b 那 个 位 置 。 


解 牛 完毕 ， 做 个 总 结 。 


定义 函数 的 格式 为 : 























def 函数 名 


(参数 


函数 体 〈 语 句 块 ) 





征 不 是 样式 很 简单 呢 ? 
几 点 说 明 3 


函数 名 的 命名 规则 要 符合 Python 中 的 命名 要 求 。 一 般 用 小 写字 母 和 
单 下 画 线 、 数 字 等 组 合 。 

def 是 定义 函数 的 关键 词 ， 这 个 简写 来 自 英 文 单词 define。 

括号 里 面 ， 可 以 有 参数 列表 ， 也 可 以 没有 参 
于 万 不 要 忘记 了 括号 后 面 的 冒号 。 

《语句 块 ) ， 相 对 于 def 缩 进 ， 按 照 Python 的 习惯 ， 缩 进 四 个 


再 通过 简单 的 例子 ， 深 入 理解 上 面 的 要 点 : 



































>>> def name(): # 定 义 一 个 无 参数 的 函数 
print "qiwsir" # 缩 进 

4 个 空格 

>>> name() # 调 用 函数 ， 打 印 结果 























diwsir 


>>> def add(x, y): # 定 义 一 个 非常 简单 的 函数 

















return x+y # 缩 进 
4 个 空格 
>>> add(2，3) # 计 算 
2+3 
5 


注意 上 面 的 add (x,，y) 函 数 ， 没 有 特别 规定 参数 “Xx，y” 的 类 型 。 
其 实 ， 这 人 句 话 本 吴 就 是 错 的 ， 前 面 已 经 多 次 提 到 ， 在 Python 中 ， 变 量 无 
类 型 ， 只 有 对 象 才 有 类 型 ， 这 人 句 话 应 该 说 成 :“x，y” 并 没有 严格 规定 其 
所 引用 的 对 象 类 型 。 这 是 Python 跟 茶 些 语言 很 大 的 区 别 ， 在 有 些 语言 
人 


为 什么 ? 读者 不 要 瑟 记 了 ， 这 里 的 所 谓 参 数 跟 前 面 说 的 变量 本 质 上 
征 一 回 事 。 只 有 当 用 到 该 变量 的 时 候 ， 才 建立 变量 与 对 象 的 对 应 关系 ， 
售 则 ， 关 系 不 建立 。 只 有 对 象 才 有 类 型 ， 那 么 ， 在 add (x，y) 函数 
中 ,“x， 史 在 引用 对 象 之 前 是 完全 球 忽 的 ， 没 有 被 贴 在 任何 一 个 对 象 
上 ， 换 句 话说 它们 有 可 能 引用 任何 对 象 ， 只 要 后 面 的 运算 许可 。 如 果 后 
面 的 运算 不 许可 ， 则 会 报错 。 


























>>> add ("qiw", "sir") 
'qiwsir' 


>>> add("qiwsir",4) 

Traceback (most recent call last): 
File "<stdin>", line 1, in <module> 
File "<stdin>", line 2, in add 

TypeError: cannot concatenate 'str' and 'int' objects # 仔 细 阅 读 报错 信息 






































从 实验 结果 中 发 现 : x+y 的 意义 完全 取 诀 于 对 象 的 类 型 。 在 Python 
中 ， 将 这 种 依赖 关系 称 之 为 多 态 。 对 于 Python 中 的 多 态 问 题 以 后 还 会 遇 
到 ， 这 里 仅仅 以 此 例子 显示 一 番 。 请 读者 要 留心 注意 : Python 中 为 对 象 
编写 接口 ， 而 不 是 为 数据 类 型 编写 。 读 者 先 留 心 一 下 这 和 句 话 ， 或 者 记 住 











它 ， 随 着 学 习 的 深入 ， 会 领悟 到 其 真 席 的 。 


此 外 ， 也 可 以 将 函数 通过 赋值 语句 与 东 个 变量 建立 引用 关系 : 





>>> result = add(3，4) 
>>> result 
7 


这 其 实 解释 了 函数 的 一 个 秘密 : add (x，y) 被 运行 之 前 ， 在 计算 
机 内 是 不 存在 的 ， 直 到 代码 运行 到 这 里 的 时 候 ， 在 计算 机 中 就 建立 起 来 
了 一 个 对 象 ， 这 就 如 同 前 面 所 学 习 过 的 字符 串 、 列 表 等 类 型 的 对 象 一 
样 ， 运 行 add (X，y) 之 后 ， 也 建立 了 一 个 add (x，y) 的 对 象 ， 这 个 对 
象 与 变量 result 可 以 建立 引用 关系 ， 并 且 add (x，y) 将 运算 结果 返回 。 
请 注意 函数 中 的 return， 它 的 作用 就 是 要 把 函数 的 结果 返回 ， 从 而 得 到 
这 个 函数 的 返回 值 。 于 是 ， 通 过 result 承 可 以 得 看 运算 结 


如 果 对 上 面 一 段 感觉 有 反 吃 力 或 者 尝 乎 ， 那 束 再 读 一 近 。 实 在 捕 
不 明白 ， 也 别 担心 ， 随 独 学 习 的 深入 ， 会 明白 的 。 





314 基于 人 各 


到 现在 为 止 ， 我 们 已 经 接触 过 变量 的 命名 和 函数 的 命名 问题 ， 似 乎 
己 经 到 了 将 命名 问题 进行 总 结 的 时 候 了 。 


0 0 0 
情 。 








Python 也 很 在 乎 名 字 问 题 ， 其 实 ， 所 有 高 级 语言 对 名 字 都 有 要 求 。 
为 什么 呢 ? 因为 如 末 命 名 乱 了， 计算 机 就 有 点 不 知 所 措 了 。 看 Python 对 


命名 的 一 般 要 求 


。 文件 名 : 全 小 写 ， 可 使 用 下 男 线 。 

。 函数 名 : 小 写 ， 可 以 用 下 画 线 风格 单词 以 增加 可 读 性 。 如 : 
my_function、my_example_function。 注 意 : 混合 大 小 写 仅 被 允许 用 
于 这 种 风格 已 经 占据 优势 的 时 候 ， 以 便 保持 同 后 兼容 。 有 的 人 豆 欢 
用 这 样 的 命名 风格 : myFunction， 除 了 第 一 个 单词 首 字 母 外 ， 后 面 
的 单词 首 字 母 大 写 。 这 也 是 可 以 的 ， 因 为 在 某 些 语言 中 就 习惯 如 














ls 

。 函数 的 参数 : 如 果 一 个 函数 的 参数 名 称 和 保留 的 关键 字 冲 突 ， 通 常 
使 用 一 个 后 级 下 夯 线 。 

。 变量 : 变量 名 全 部 小 写 ， 由 下 辆 线 连 接 各 个 单词 。 如 
color=WHITE, this is a variable=1。 


其 实 ， 关 于 命名 的 问题 ， 还 有 不 少 争 论 ， 最 典型 的 是 所 谓 匈 牙 利 命 
名 法 、 怠 峰 命 名 等 。 


Python 本 号 有 一 套 命名 的 官方 规范 ， 读 者 可 以 参考 : 
http://legacy.python.org/dev/peps/pep-0008/#prescriptive-naming- 
conventions。 








3.1.5 “调用 函数 





前 面 的 例子 中 己 经 有 了 一 些 关 于 调用 的 问题 ， 为 了 深入 理解 ， 把 这 
个 问题 单独 拿 出 来 看 看 。 


为 什么 要 写 函 数 ? 从 理论 上 说 ， 不 用 函数 也 能 够 编程 ， 我 们 在 前 面 
己 经 写 了 程序 ， 就 没有 写 函 数 ， 当 然 ， 用 Python 的 内 建 函 数 姑且 不 算 。 
之 所 以 使 用 函数 主要 原因 是 : 


。 降低 编程 的 难度 ， 通 各 将 一 个 复杂 的 大 问题 分 解 成 一 系列 更 简单 的 
小 问题 ， 然 后 将 小 问题 继续 划分 成 更 小 的 问题 ， 当 问题 细 化 为 足够 
简单 时 ， 就 可 以 分 而 治之 。 为 了 实现 这 种 分 而 治之 的 设想 ， 就 要 通 
过 编写 函数 ， 将 各 个 小 问题 逐个 击破 ， 再 集合 起 来 ， 解 决 大 的 问 

题 。 请 注意 ， 分 而 治之 的 思想 是 编程 的 一 个 重要 思想 ， 所 请“ 分 
治 ” 方 法 也 。) 

代码 重用 。 在 编程 的 过 程 中 ， 比 较 忌 讳 同 样 一 段 代码 不 断 重 复 ， 所 
以 ， 定 义 一 个 函数 ， 可 以 多 次 被 使 用 。 当 然 ， 后面 我 们 还 会 讲 

到 "模块 >， 还 可 以 把 函数 放 到 一 个 模块 中 供 其 他 程序 员 使 用 。 也 可 
以 使 用 其 他 程序 员 定 义 的 函数 《比如 import， 前 面 已 经 用 到 了 ， 就 
古 应 用 了 别人 一 一 创造 Python 的 人 一 一 写 好 的 函数 ) ， 这 就 避免 了 
重复 开动 ， 提 高 了 工作 效率 。 


这 样 看 来 ， 使 用 函数 还 是 很 有 必要 的 。 下 面 就 看 函数 怎么 调用 吧 。 














以 add (x，y) 为 例 ， 前 面 已 经 演示 了 基本 调用 方式 ， 此 外 ， 还 可 以 这 
样 : 


>>> def add(x, y): 

0 print "x=", x 
print "y=", y 
return x+y 


>>> add(10, 3) #X=10, y=3 
X= 10 
y= 3 


>>> add(3, 10) #X=3, y=10 
x= 3 

y= 10 

13 


所 谓 调用 ， 最 关键 是 要 和 并 清楚 如 何 给 函数 的 参数 赋值 。 这 里 吕 是 按 
照 参数 次 厅 赋 值 ， 根 据 参数 的 位 置 ， 值 与 之 对 应 。 


还 可 以 直接 把 赋值 语句 写 到 里 面 ， 就 明确 了 参数 和 对 象 的 天 系 。 


>>> add(x=10, y=3) # 同 上 


当然 ， 这 时 候 顺 友 就 不 重要 了 ， 也 可 以 这 样 : 


>>> add(y=10, x=3) 
X= 3 

y= 10 

13 


在 定义 函数 的 时 候 ， 参 数 可 以 像 前 面 那样 等 每 被 赋值 ， 也 可 以 定义 
的 时 候 束 赋 给 一 个 默认 值 。 例 如 : 


>>> def times(x, y=2): 

ee print "x=", x 
print "y=", y 
return x * y 

>>> times(3) 

X= 3 


y= 2 
6 


> 


>> times(x=3) 


X= 3 


y 
6 


= 2 


如 采 不 给 那个 有 默认 值 的 参数 传递 值 〈 赋 值 的 另外 一 种 说 法 ) ， 那 


么 它 束 是 用 默认 的 值 。 如 采 给 它 传 一 个 ， 则 采用 新 赋 给 它 的 值 。 如 下 : 


> 


P<~xN 


> 


x 
y 









































>> times(3, 4) #X=3, y=4, y 的 值 不 再 是 
= 3 

= 4 

2 

>> times("qiwsir") # 再 次 体现 了 多 态 特点 

= qiwsir 

= 2 

qiwsirdqiwsir， 


给 各 位 读者 提 一 个 思考 题 ， 请 在 闲暇 之 余 用 Python 完成 : 写 两 个 数 


的 加 、 减 、 乘 、 除 的 函数 ， 然 后 用 这 些 函 数 ， 完 成 简单 的 计算 。 


3.1.6 注意 事项 


河 泪 


把 编写 程序 的 注意 事项 单独 作为 一 个 小 市 提出 ， 目 的 古 提醒 读者 注 
因为 这 些 方面 的 问题 ， 往 往 成 为 困扰 读者 “特别 是 初学 者 ) 的 及 





别 筷 了 冒号 。 一 定 要 记 住 符合 语句 首 行 末 尾 输入 “: ”(if，while， 
for 等 的 第 一 行 ) 。 





。 从 第 一 行 开始 。 要 确定 顶层 〈 无 舱 套 ) 程序 代码 从 第 一 行 开始 。 
。 空白 行 在 交互 模式 提示 符 下 很 重要 。 模 块 文件 中 符合 语句 内 的 空白 





行 常 被 忽视 。 但 是 ， 当 你 在 交互 模式 提示 符 下 输入 代码 时 ， 空 白 行 
则 会 结束 语句 。 

缩 进 要 一 致 。 避 免 在 块 缩 进 中 混合 制 表 符 和 空格 。 

使 用 简洁 的 for 循 环 ， 而 不 是 while or range。 相 比 ，for 循 环 更 易 写 ， 
运行 起 来 也 更 快 。 








要 注意 赋值 语句 中 的 可 变 对 象 。 

不 要 期 竺 在 原 处 修改 的 函数 会 返回 结果 ， 比 如 1listappend0， 这 在 可 
修改 的 对 象 中 要 特别 注意 。 

调用 函数 时 ， 函 数 名 后 面 一 定 要 跟随 痢 括 号 ， 有 时 候 括号 里 面 就 是 
空空 的 ， 有 时 候 里 面 放 参 数 。 

不 要 在 导入 和 重 载 ( 先 记 住 有 这 样 一 个 名 词 ， 后 面 会 反复 出 现 ， 慢 
慢 就 能 理解 含义 了 ， 实 在 忍 不 住 就 搜索 一 下 。) 中 使 用 扩展 名 或 路 


六 
径 。 


以 上 各 点 如 果 有 不 理解 的 也 不 要 紧 ， 在 以 后 编程 中 ， 时 不 时 地 回来 
复习 一 下 ， 能 不 断 领悟 其 内 涵 。 


3.1.7 返回 值 








前 面 写 的 函数 有 扣 缺 憾 ， 不 知道 读者 是 否 觉察 到 了 ， 即 结果 是 用 
print 语 句 打 印 出 来 的 。 这 是 实际 编程 中 广泛 使 用 的 吗 ? 肯定 不 是 。 因 为 
函数 在 编程 中 是 一 段 具 有 抽象 价值 的 代码 ， 一 般 情况 下 ， 用 它 得 到 一 个 
结果 ， 这 个 结果 要 用 在 其 他 的 运算 中 。 所 以 ， 不 能 仅仅 局 限 在 把 某 个 结 
果 打 印 出 来 ， 函 数 必须 返回 一 个 结果 。 


为 了 能 够 说 明 清 楚 ， 先 编写 一 个 函数 。 


根据 高 德 纳 (Donald Ervin Knuth) 的 《计算 器 程序 设计 艺术 》 

(The Art of Computer Programming) ，1150 年 印度 数学 家 Gopala 和 人 金 月 
在 研究 箱子 包装 对 象 长 宽 刚 好 为 1 和 2 的 可 行 方法 数目 时 ， 首 先 描述 这 个 
数列 。 在 西方 ， 最 先 研究 这 个 数列 的 人 是 比萨 的 李 奥 纳 多 (意大利 人 韭 
波 那 契 Leonardo Fibonacci) ， 他 在 描述 兔子 生长 的 数目 时 用 上 了 这 个 数 
列 。 


第 一 个 月 初 有 一 对 刚 诞 生 的 兔子 ， 第 二 个 月 之 后 《第 三 个 月 初 ) 它 
| 每 月 每 对 可 生育 的 兔子 会 诞生 下 一 对 新 兔子 ， 免 子 永 不 死 














假设 在 n 月 有 可 生育 的 兔子 总 共 a 对 ，n+1 月 就 总 共有 b 对 。 在 n+2 月 
必定 总 共有 a+b 对 : > 因为 在 n+2 月 的 时 候 ， 前 一 月 Cn+1 月 ) 的 b 对 兔子 
可 以 存留 至 第 n+2 月 〈 在 当月 属于 新 诞生 的 兔子 尚 不 能 生育 ) 。 而 新 生 











育 出 的 兔子 对 数 等 于 所 有 在 n 月 就 已 存在 的 a 对 。 


辈 波 那 负 数 列 的 函数 ， 从 而 可 以 实现 任意 的 
数列 。 


参考 代码 : 


#!/UsSr/bin/env python 
# coding=utf-8 


def fibs(n): 
result = [0, 1] 
for i in range(n-2): 
result.append(result[-2] + result[-1]) 
return result 


if me == "_ mai 
Lot = es 
print lst 





把 含有 这 些 代 码 的 文件 保存 成 名 为 20202.py 的 文件 。 


在 这 个 文件 中 ， 首 先 定 义 了 一 个 函数 ， 名 字 叫 作 fibs， 其 参数 是 输 
入 一 个 整数 (当然 ， 函 数 并 没有 对 此 进行 限制 ， 也 没有 必要 限制 ， 这 就 
是 Python 的 脾气 和 性 格 。) 。 然 后 ， 通 过 lst=fibs (10) 调用 这 个 函数 。 
这 里 参数 给 的 是 10， 就 意味 着 要 得 到 n= 10 的 辈 波 那 契 数列 。 


运行 后 打印 数列 : 











$ python 20202.py 
[0, 1, 1, 2, 3, 5, 8, 13, 21, 34] 


当然 ， 如 果 要 换 n 的 值 ， 只 需要 在 调用 函数 的 时 候 ， 修 改 一 下 参数 
即 可 ， 这 才 体 现 出 函数 的 优势 呢 。 


观察 fibs 函 数 ， 最 后 有 一 个 语句 return result， 意 思 是 将 变量 result 的 
值 返回 。 返 回 给 谁 呢 ? 一 般 这 类 函数 调用 的 时 候 ， 要 通过 类 似 
lst=fibs (10) 的 语句 ， 那 么 返回 的 那个 值 就 被 变量 lst 贴 上 了 了， 通过]st 束 
能 得 到 该 值 。 如 果 没 有 这 个 赋值 语句 ， 虽 然 函 数 照样 返回 值 ， 但 是 它 球 
ee 我 们 无 法 抓 出 来 ， 并 且 最 终 还 被 当 作 垃圾 被 Python 回收 





上 面 的 函数 只 返回 了 一 个 返回 值 〈 有 是 一 个 列表 ) ， 奉 你 需要 返回 多 





个 也 是 可 以 的 ， 只 不 过 是 以 元 组 形式 返回 。 
>>> def my_fun(): 
return 1,2,3 
>>> a = my_ fun() 


>>> a 
(1, 2, 3) 


有 的 水 数 没 有 renturn 一 样 执 行 完毕 ， 就 算 也 干 了 某 些 活 儿 吧 。 事 实 
上 上， 不 是 没有 返回 值 ， 只 不 过 是 None。 比 如 这 样 一 个 函数 : 


>>> def my_fun(): 
print "I am doing somthing." 


在 交互 模式 下 构造 一 个 很 简单 的 函数 ， 注 意 ， 这 是 构造 了 一 个 简单 
函数 ， 如 果 是 复杂 的 函数 ， 千 万 不 要 在 交互 模式 下 人 做。 如果 你 非 要 做 ， 
则 会 尝 到 苦头 。 

这 个 函数 的 作用 束 是 打印 出 一 段 话 ， 即 执行 这 个 函数 就 能 打印 出 那 
段 话 ， 但 是 没有 return。 


>>> a = my_fun() 
I am doing somthing. 


我 们 再 看 看 那个 变量 a， 到 底 是 什么 。 


>>> print a 
None 





这 就 是 只 干 活 儿 没有 return 的 函数 ， 返 回 给 变量 的 是 一 个 None。 这 
种 模样 的 函数 通常 不 用 上 述 方式 调用 ， 而 采用 下 面 的 方式 ， 因 为 他 们 返 
回 的 是 None， 似 乎 这 个 返回 值 的 利用 价值 不 高 ， 所 以 不 用 找 一 个 变量 来 
接受 返回 值 了 。 


>>> my_fun( 
I am doing somthing. 





特别 注意 那个 return， 它 还 有 一 个 作用 。 观 察 下 面 的 函数 和 执行 结 
果 ， 看 看 能 不 能 发 现 它 的 另外 一 个 作用 。 


>>> def my_fun(): 


print "I am coding." 
return 
print "I finished." 


>>> my_fun() 
I am coding. 


看 出 玄机 了 吗 ? 在 函数 中 ， 本 来 有 两 个 print 语 句 ， 但 是 中 间 插 入 了 
一 个 return， 仪 仪 是 一 个 return。 当 执行 函数 的 时 候 ， 只 执行 了 第 一 个 
print 语 句 ， 第 二 个 并 没有 执行 。 这 是 因为 执行 第 一 个 语句 之 后 ， 遇 到 了 
return， 它 告诉 函数 要 返回 ， 即 中 断 函 数 体内 的 流程 ， 离 开 这 个 函数 ， 
结果 第 二 个 print 就 没有 被 执行 。 所 以 ，returm 在 这 里 就 有 了 一 个 作用 ， 
nn 


3.1.8 ”函数 中 的 文档 


“程序 在 大 多 数 情况 下 是 给 人 看 的 ， 只 是 偶尔 被 机 器 执行 一 下 。” 


所 以 ， 写 程序 必须 要 写 注释 。 有 人 宣称 ， 好 代码 是 不 需要 注释 的 。 
对 此 ， 我 表示 赞同 ， 但 是 前 提 是 “好 代码 ?”。 如 果 写 不 出 “好 代码 ”， 是 不 
征 就 需要 注释 了 呢 ? 大 多 数 程序 员 ， 包 括 我 在 内 ， 都 不 能 保证 目 己 的 代 
码 属 于 人 见 人 爱 的 “好 代码 ”， 上 所以， 注释 是 必要 的 。 


前 面 已 经 有 过 说 明 ， 如 果 共 一行 用 #J 始 ，Python 就 不 执行 它 后 面 
ee 
人 


除了 这 样 的 一 句 之 外 ， 一 般 在 每 个 函数 名 字 的 下 面 ， 还 要 写 一 写 文 
档 ， 以 此 来 说 明 这 个 函数 的 用 途 。 




















#!/Uusr/bin/env python 
# coding=utf-8 


def fibs(n): 
This is a Fibonacci sequence. 
result = [0,1] 
for i in range(n-2): 


result.append(result[-2] + result[-1]) 
return result 


if name == "main " 
lst = fibs(10) 
print lst 





在 这 个 函数 的 名 称 下 面 ， 用 三 个 引号 的 方式 ， 包 囊 着 对 这 个 函数 的 
说 明 ， 即 函数 文档 。 


为 了 能 清晰 地 了 解 函 数 文档 ， 先 写 一 个 简 蛙 的 函数 例子 。 


>>> def add(x, y): 
return x+y 
>>> dir(add) 
['_call ', '_class ', '_ Cclosure ', '_ code ', '_ defaults ', '_ delattr_ _' 








请 读者 用 你 那 一 双 芒 眼 找 一 找 ， 有 没有 这 样 一 个 东西 : _ doc_， 
它 里 面 就 记录 着 这 个 函数 的 文档 信息 。 





>>> print add. doc _ 
None 


居然 是 None， 这 没有 错 。 因 为 上 面 的 函数 根本 就 没有 写 文档 内 容 ， 
如 果 不 是 None 那 才 是 有 问题 呢 。 


下 面 增加 点 儿 东 西 ， 就 是 函数 文档 。 





>>> def add(x, y): 
Wr add x and Yn 
return x+y 


>>> print add._ doc _ 
add x and y. 


这 显示 了 函数 文档 的 内 容 。 这 样 为 每 个 函数 都 做 了 一 个 简要 说 明 ， 
证 调用 这 个 函数 的 人 明白 函数 的 作用 和 使 用 意图 ， 我 代表 另外 一 个 你 不 
0 3 8 0 0 
烦恼 。 


3.2 名词 辨 析 


在 函数 中 ， 有 一 些 名 词 容 易 让 人 糊涂 ， 甚 至 闻 币 谈 起 ， 但 不 知道 其 
需要 对 这 些 名 词 深究 一 番 。 


3.2.1 参数 和 变量 


参数 ， 是 貌似 比较 复杂 的 ， 所 以 要 深入 讨论 。 


在 程序 员 中 里 ， 你 或 许 听 说 过 “ 形 参 ”"“ 实 参 ” “参数 ?等 名 词 ， 到 
底 指 什么 呢 ? 


在 定义 函数 的 时 候 《〈def 来 定义 函数 ， 称 为 def 语 铝 ) ， 冰 数 名 后 面 
的 括号 里 如 果 有 变量 ， 它 们 通常 被 称 为 “ 形 参 "。 调 用 函数 的 时 候 ， 给 函 
数 提供 的 值 叫 作 “ 实 参 ”， 或 者 “参数 ”。 


其 实 ， 如 果 你 区 别 不 开 ， 也 不 会 耽误 你 写 代 码 ， 这 只 不 过 类 似 孔 乙 
己 先生 知道 苏 香 豆 的 苏 字 有 多 少 种 写法 寺 了。 但 是 ， 我 居然 碰 到 过 茶 公 
司 面 试 官 问 这 种 问题 。 


我 们 就 简化 一 下 ， 笼 统 地 把 函数 括号 里 面 的 变量 叫 作 参数 吧 ， 当 
然 ， 你 叫 作 变量 也 无 妨 ， 只 要 大 家 都 知道 指 的 是 什么 东西 就 好 了 。 虽 然 
这 样 说 会 引起 某 些 认真 的 人 来 喷 口 水 ， 但 不 用 担心 ， 反 正本 书 已 经 声明 
是 很 “水 ”的 了 。 

但 如 果 有 人 较真 ， 非 要 让 你 区 分 ， 为 了 显示 你 的 水 平 ， 你 可 以 引用 
微软 网 站 上 的 说 明 。 我 认为 这 段 说 明 高 度 抽象 ， 而 且 意 义 涵 盖 深 远 。 摘 
抄 过 来 ， 请 读 一 读 ， 看 看 是 否 理解 。 

参数 和 变量 之 间 的 差异 (Visual Basic ) 


多 数 情况 下 ， 过 程 必 须 包 含有 关 调 用 环境 的 一 些 信息 。 执 行 重 复 或 


























共 至 任务 的 过 程 对 每 次 调用 使 用 不 同 的 信息 。 此 信息 包含 每 次 调用 过 程 
时 传递 给 它 的 变量 、 常 量 和 表达 式 。 


奉 要 将 此 信息 传递 给 过 程 ， 过 程 先 要 定义 一 个 形 参 ， 然 后 调用 代码 
将 一 个 实 参 传递 给 所 定义 的 形 参 。 您 可 以 将 形 参 当 作 一 个 停车 位 ， 而 将 
实 参 当 作 一 辆 汽车 。 就 像 一 个 停车 位 可 以 在 不 同时 间 停 放 不 同 的 汽车 一 
样 ， 调 用 代码 在 每 次 调用 过 程 时 可 以 将 不 同 的 实 参 传递 给 同一 个 形 参 。 


形 参 表示 一 个 值 ， 过 程 希望 您 在 调用 它 时 传递 该 值 。 


当 您 定义 Function 或 Sub 过 程 时 ， 需 要 在 紧 跟 过 程 名 称 的 括号 内 指定 
形 参 列表 。 对 于 每 个 形 参 ， 您 可 以 指定 名 称 、 数据 关 型 和 传 信 机制 
(ByVal (Visual Basic) 或 ByRef (Visual Basic) ) 。 您 还 可 以 指示 某 
个 形 参 是 可 选 的 。 这 意味 着 调用 代码 不 必 传递 它 的 值 。 


每 个 形 参 的 名 称 均 可 作为 过 程 内 的 局 部 变量 。 形 参 名 称 的 使 用 方法 
与 其 他 任何 变量 的 使 用 方法 相同 。 


实 参 表示 在 您 调用 过 程 时 传递 给 过 程 形 参 的 值 。 调 用 代码 在 调用 过 
程 时 提供 参数 。 


调用 Function 或 Sub 过 程 时 ， 需 要 在 紧 跟 过 程 名 称 的 括号 内 包括 实 参 
列表 。 每 个 实 参 均 与 此 列表 中 位 于 相同 位 置 的 那个 形 参 相 对 应 。 


与 形 参 定义 不 同 ， 实 参 没 有 名 称 。 每 个 实 参 就 是 一 个 表达 式 ， 它 包 
含 零 或 多 个 变量 、 常 数 和 文本 。 求 值 的 表达 式 的 数据 类 型 通常 应 与 为 相 
应 形 参 定 义 的 数据 类 型 相 匹 配 ， 并 且 在 任何 情况 下 ， 该 表达 式 值 都 必须 
可 转换 为 此 形 参 类 型 。 

看 完 这 上 段 引文 会 发 现 里 面 有 儿 个 关键 词 ， 参数 、 变 量 、 形 参 

。 本 来 想 弄 清楚 参数 和 变量 ， 结 果 又 冒 出 另外 两 个 词 ， 更 混乱 了 。 请 
J 在 编程 业界 ， 类 似 的 东西 有 很 多 名 词 。 下 次 听 到 有 人 说 这 些 
就 不 用 害怕 啦 ， 反 正 自己 听 过 了 。 

在 Python 中 ， 没 有 这 么 复杂 。 


看 完 上 面 让 人 坚 头 转 问 的 引文 之 后 ， 再 看 下 和 面 的 代码 束 会 具 然 开明 





























>>> def add(x): #X 是 参数 ， 准 确 说 是 形 参 












































a = 10 #a 是 变量 

return a + X #x 就 是 那个 形 参 作为 变量 ， 其 本 质 是 要 传递 赋 给 这 个 函数 的 值 
>>> x =3 #X 是 变量 ， 只 不 过 在 函数 之 外 
>>> add(x) # 这 里 的 





x 是 参数 ， 但 是 它 由 前 面 的 变量 














Xx 传递 对 象 


3 
13 
>>> add(3) # 把 上 面 的 过 程 合 并 了 























13 








人 至此， 读者 是 否 清楚 了 一 点 点 。 其 实 没有 那么 复杂 。 关 键 要 理解 





数 名 括号 后 面 的 东西 的 作用 是 传递 值 。 








3.2.2 全 局 变量 和 局 部 变量 











里 然 是 讲 参 数 ， 但 是 关于 全 局 变量 和 局 部 变量 的 区 别 也 要 先 弄 清 
楚 ， 因 为 关系 到 函数 内 外 有 别 的 大 事 。 


下 面 这 段 代码 中 有 一 个 函数 funcx0， 这 个 函数 里 面 有 一 个 变量 
x=9， 在 函数 的 前 面 也 有 一 个 变量 x=2。 


x=2 


def funcx(): 
X = 9 
print "this x is in the funcx:-->", x 


[ea 


funcx() 
print "-------------------------- WW 
print "this x is out of funcx:-->", x 


那么 ， 这 段 代 码 输出 的 结果 是 什么 呢 ? 看 : 








this x is in the funcx:--> 9 


this x is out of funcx:--> 2 


从 输出 看 出 ， 运 行 funcx()， 输 出 了 funcx0 里 面 的 变量 x=9; 然后 执 
行 代码 中 的 最 后 一 行 ，print"this x is out of funcx:-->"，xX 


要 特别 关注 的 是 ， 前 一 个 x 输出 的 是 函数 内 部 的 变量 x;， 后 一 个 x 输 
出 的 是 函数 外 面 的 变量 x。 两 个 变量 彼此 没有 互相 影响 ， 虽 然 部 是 x。 从 
这 里 看 出 ， 两 个 x 各 自在 各 自 的 领域 内 起 到 作用 。 


把 那个 只 在 函数 体内 《〈 茶 个 范围 内 ) 起 作用 的 变量 称 之 为 局 部 变 











地 ln 











有 局 部 器 有 对 应 的 全 部 ， 感 觉 很 别扭 ， 局 部 对 应 的 是 全 局 ， 不 是 全 
部 ， 所 以 又 来 了 一 个 名 词 : 全 局 变量 。 


X = 2 

def funcx(): 
global x # 跟 上 面 函 数 的 不 同 之 处 
X = 9 


print "this x is in the funcx:-->", x 


funcx() 
print "-------------------------- WW 
print "this x is out of funcx:-->",x 


以 上 两 段 代码 的 不 同 之 处 在 于 ， 后 者 在 函数 内 多 了 一 个 global x， 
这 句 话 的 意思 是 在 声明 x 是 全 局 变量 ， 也 就 是 说 这 个 x 跟 函数 外 面 的 那个 
全 接 下 来 通过 x=9 将 x 的 引用 对 象 变 成 了 9。 所 以 ， 束 出 现 了 下 
> 结果 。 














this x is in the funcx:--> 9 


this x is out of funcx:--> 9 





好 似 全 局 变量 能 力 很 强悍 ， 能 够 统帅 函数 内 外 。 但 是 ， 要 注意 ， 这 
人 
一 定 要 注意 。 








3.2.3 ”命名 空间 





命名 空间 是 一 个 比较 不 容易 理解 的 概念 ， 特 别 是 对 于 初学 者 而 言 ， 
似乎 它 很 绿 缘 。 我 在 维基 百科 中 看 到 对 它 的 定义 ， 不 仅 定 义 比较 好 ， 连 
里 面 的 例子 都 不 错 。 所 以 ， 抄 录 下 来 ， 帮 助 读者 理解 这 个 名 词 。 


命名 空间 (英语 : Namespace) 表示 标识 符 (identifier〉 的 可 见 范 
转 。 一 个 标识 符 可 在 多 个 命名 空间 中 定义 ， 它 在 不 同 命名 空间 中 的 含义 
是 互 不 相干 的 。 在 一 个 新 的 命名 空间 中 可 定义 任何 标识 符 ， 它 们 不 会 与 
任何 已 有 的 标识 符 发 生 冲 突 ， 因 为 已 有 的 定义 都 处 于 其 他 命名 空间 中 。 


例如 ， 设 Bill 是 X 公 司 的 员工 ， 工 号 为 1223， 而 John 是 Y 公 司 的 员 
工 ， 工 号 也 是 123。 由 于 两 人 在 不 同 的 公司 工作 ， 可 以 使 用 相同 的 工 号 
来 标识 而 不 会 造成 混乱 ， 这 里 每 个 公司 就 表示 一 个 独立 的 命名 空间 。 如 
0 
会 发 生 混乱 。 


这 一 特点 是 使 用 命名 空间 的 主要 理由 。 在 大 型 的 计算 机 程序 或 文档 
中 ， 往 往 会 出 现 数 百 或 数 干 个 标识 符 。 命 名 空间 提供 一 隐藏 区 域 标识 符 
的 机 制 。 通 过 将 逻辑 上 相关 的 标识 符 组 织 成 相应 的 命名 空间 ， 可 使 整个 
系统 更 加 模块 化 。 


在 编程 语言 中 ， 命 名 空间 是 对 作用 域 的 一 种 特殊 的 抽象 ， 它 包含 了 
处 于 该 作用 域内 的 标识 符 ， 且 本 映 也 用 一 个 标识 符 来 表示 ， 这 样 便 将 一 
系列 在 逻辑 上 相关 的 标识 符 用 一 个 标识 符 组 织 了 起 来 。 许 多 现代 编程 语 
言 都 文 持 命名 空间 。 在 一 些 编程 语言 〈 例 如 C++ 和 Python ) 中 ， 命 名 空 
间 本 喘 的 标识 符 也 属于 一 个 外 层 的 命名 空间 ， 即 命名 空间 可 以 肉 套 ， 构 
成 一 个 命名 空间 树 ， 树 根 则 是 无 名 的 全 局 命名 空间 。 


函数 和 类 的 作用 域 可 被 视 作 隐 式 命名 空间 ， 它 们 和 可 见 性 、 可 访问 
性 和 对 象 生命 周期 不 可 分 割地 联系 在 一 起 。 











显然 ， 用 “命名 空间 ?或 者 “作用 域 " 这 样 的 名 词 ， 就 是 因为 有 了 函数 
(后 面 还 会 有 类 ) 之 后 ， 在 函数 内 外 都 可 能 有 外 形 一 样 的 符号 《标识 
人 符 ) ， 在 Python 中 (乃至 于 其 他 高 级 语言 》， 为 了 区 分 此 变量 非 彼 变量 
《虽然 外 形 一 样 ) ， 需 要 用 这 样 的 东西 来 框 定 每 个 变量 所 对 应 的 值 〈 发 
生 作 用 的 范围 ) 。 


前 面 己 经 讲 过 ， 变 量 和 对 象 〈 就 是 所 变量 所 对 应 的 值 ) 之 间 的 关系 
是 : 变量 类 似 标签 ， 贴 在 了 对 象 上 ， 即 通过 赋值 语句 实现 了 一 个 变量 标 
签 对 应 一 个 数据 对 象 〈 值 ) ， 这 种 对 应 关系 让 你 想起 了 什么 ? 映射 ! 
Python 中 唯一 的 映射 束 是 字典 ， 里 面 有 “ 键 / 值 对 ”。 变 量 和 值 的 关系 就 有 
点 像 “ 键 > 和“ 值 ? 的 关系 。 有 一 个 内 建 函 数 vars， 可 以 帮助 我 们 研究 一 下 
这 种 对 应 关系 。 











>>> X = 7 

>>> scope = vars() 
>>> scope['x'] 

7 


>>> scope['x'] += 1 
>>> x 


>>> scope['x'] 
8 








既然 如 此 ， 诚 如 前 面 的 全 局 变量 和 局 部 变量 ， 即 使 是 同样 一 个 变量 
名 称 ， 但 是 它 在 不 同 范围 《用 "命名 空间 ”更 专业 ) 对 应 不 同 的 值 。 


3.3 ”参数 收集 


在 函数 中 ， 参 数 的 个 数 有 时 候 是 一 个 ， 比 如 一 个 用 来 计算 圆 面积 的 
函数 ， 它 所 需要 的 参数 就 是 半径 (raA2) ， 这 个 函数 的 参数 是 确定 的 。 


然而 ， 这 个 世界 不 总 是 这 么 简单 的 ， 有 时 候 参 数 个 数 是 多 个 ， 甚 至 
不 是 确定 的 ， 不 确定 性 或 许 更 是 常态 。 如 采 读 者 了 解 量子 力学 就 更 理解 
真正 的 不 确定 性 了 。 当 然 ， 不 用 研究 量子 力学 也 一 样 能 够 体会 到 ， 世 界 
0 
情况 。 


3.3.1 参数 收集 


Python 用 这 样 的 方式 解决 参数 个 数 的 不 确定 性 : 


def func(x,*arg): 
print x 
result = x 
print arg 
for i in arg: 
result +=i 
return result 
print func(1, 2, 3, 4, 5, 6, 7, 8, 9) # 赋 给 函数 的 参数 个 数 不 仅 仅 是 


2 个 


运行 此 代码 后 ， 得 到 如 下 结果 : 


1 # 这 是 第 一 个 





print， 参 数 


Xx 得 到 的 值 是 


1 
(2，3，4，5，6，7，8，9)# 这 是 第 二 个 





print， 参 数 


arg 得 到 的 是 一 个 元 组 








45 # 最 后 的 计算 结果 


从 上 面 例子 可 以 看 出 ， 如 果 输 入 的 参数 个 数 不 确 定 ， 其 他 参数 全 部 
通过 *arg， 以 元 组 的 形式 由 arg 收 集 起 来 。 对 照 上 面 的 例子 不 难 发 现 ; 


。 值 1 传 给 了 参数 X。 
。 信 2、3、4、5、6、7、8、9 被 宗 入 一 个 tuple 里 面 ， 传 给 Jarg。 


为 了 能 够 更 明显 地 看 出 arg《〈 名 称 可 以 不 一 样 ， 但 是 符号 * 必 须要 
有 ) ， 可 以 用 下 面 的 一 个 简单 函数 来 演示 : 





>>> def foo(*args ) : 
print args # 打 印 通过 这 个 参数 得 到 的 对 象 




















下 面 演示 分 别传 入 不 同 的 值 ， 通 过 参数 *args 得 到 的 结 


>>> foo(1, 2, 3) 


(1, 2, 3) 

>>> foo( "gqiwsir", "qiwsir.github.io", "python") 

('gdiwsir', 'qiwsir.github.io', 'python') 

>>> foo("gqiwsir", 307, ["qiwsir",2], {"name":"qiwsir", "lang":"python"}) 


('gdiwsir', 307, ['qgqiwsir', 2], {'lang': 'python', 'name': 'qiwsir'}) 


不 管 是 什么 ， 都 一 股 脑 地 老 进 了 tuple 中 。 


>>> foo("python") 
( python ，) 





即使 只 有 一 个 值 ， 也 是 用 tuple 收 集 它 。 特 别 注意 ， 在 tuple 中 ， 如 果 
只 有 一 个 元 素 ， 后 面 要 有 一 个 逗号 。 


还 有 一 种 可 能 ， 就 是 不 给 那个 *args 传 值 ， 这 也 是 许可 的 。 例 如 : 


>>> def foo(x, *args): 
print "x:", x 
print "tuple:", args 
>>> foo(7) 
Xn 7 
tuple: () 


这 时 候 *args 收 集 到 的 是 一 个 空 的 tuple。 


在 各 类 编程 语言 中 ， 常 常会 过 到 以 foo、bar、foobar 等 之 类 的 命 
名 ,不管 是 对 变量 、 函 数 还 是 后 面 要 讲 到 的 类 。 这 是 什么 意思 呢 ? 下 面 
是 来 自 维 基 百 科 的 解释 。 


在 计算 机 程序 设计 与 计算 机 技术 的 相关 文档 中 ， 术 语 foobar 是 一 个 
常见 的 无 名 氏 化 名 ， 常 被 作为 “ 伪 变 量 ” 使 用 。 


从 技术 上 讲 , “foobar" 很 可 能 在 20 世 纪 60 年 代 至 70 年 代 初 通过 迪 吉 
多 的 系统 手册 传播 开 来 。 另 一 种 说 法 是 , “foobar 可 能 来 源 于 电子 学 中 
反 转 的 foo 信 号 ; 这 是 因为 如 果 一 个 数字 信和 号 是 低 电 平 有 效 〈 即 负 压 或 
零 电压 代表 “1”) ， 那 么 在 信号 标记 上 方 一 般 会 标 有 一 根 水 平 横 线 ， 而 





























横 线 的 英文 即 为 "bar"。 在 《新 黑客 秤 典 》 中 ， 还 提 到 “foo” 可 能 
于 “FUBAR” 出 现 。 


单词 “foobar” 或 分 离 的 “foo” 与 “bar”* 常 出 现 于 程序 设计 的 案例 中 ， 如 
同 Hello World 程 序 一 样 ， 它 们 和 常 被 用 于 同学 习 者 介绍 某 种 程序 语 
言 。“foo” 常 被 作为 函数 / 方法 的 名 称 ， 而 “bar* 则 第 被 用 作 变 量 名 。 


除了 用 args 这 种 形式 的 参数 接收 多 个 值 之 外 ， 还 可 以 用 “**kargs” 的 
形式 接收 数值 ， 不 过 这 次 有 点 不 一 样 : 


>>> def foo(**kargs): 
print kargs 








>>> foo(a=1, b=2, c=3) # 注 意 观 察 这 次 赋值 的 方式 和 打印 的 结果 


如 果 这 次 还 用 foo (1，2，3) 的 方式 ， 会 有 什么 结果 呢 ? 


>>> foo(1, 2, 3) 
Traceback (most recent call last): 
File "<stdin>", line 1, in <module> 
TypeError: foo() takes exactly 0 arguments (3 given) 





如 采用 **kargs 的 形式 收集 值 ， 会 得 到 字典 类 型 的 数据 ， 但 是 ， 需 要 
0 0 








把 上 面 的 几 种 情况 综合 起 来 ， 看 看 有 什么 效果 。 


>>> def foo(x, y, z, *args, **kargs): 
print x 
print y 
print z 
print args 
print kargs 
>>> foo('gqiwsir', 2, "python") 
diwsir 
2 
python 


{} 
>>> foo(1, 2, 3, 4, 5) 


>>> foo(1, 2, 3, 4, 5, name="qiwsir") 
1 

2 

3 

(4, 5) 

{'name': 'qiwsir'} 


这 样 就 能够 足以 应 付 各 种 各 样 的 参数 要 求 了 。 


3.3.2 更 优雅 的 方式 


>>> def add(x, y): 
return x+y 


>>> add(2, 3) 
5 


这 是 通常 的 函数 调用 方法 ， 在 前 面 已 经 忻 次 用 a 到。 这 种 方法 简单 明 
快 ， 很 容易 理解 。 但 是 ， 世 界 总 是 多 样 性 的 ， 甚 至 在 某 种 情况 下 你 秀 出 
下 面 的 方式 可 能 更 优雅 。 





>>> bars = (2, 3) 
>>> add(*bars) 
5 


先 把 要 传 的 值 放 到 元 组 中 ， 赋 值 给 一 个 变量 bars， 然 后 用 
add (*bars) 的 方式 ， 把 值 传 到 函数 内 ， 这 有 点 像 前 面 收集 参数 的 逆 过 


>>> bars = (2，3，4) 
>>> add(*bars ) 
Traceback (most recent call last): 
File "<stdin>", line 1, in <module> 
TypeError: add() takes exactly 2 arguments (3 given) 





就 报错 了 。 


这 是 使 用 一 个 星 写 *， 以 元 组 形式 传 值 ， 如 果 用 ** 的 方式 ， 是 不 是 
应 该 以 字典 的 形式 传 值 呢 ? 理 当 如 此 。 





>>> def book(author, name): 
print "%s is writing %s" % (author, name) 


>>> bars = {"name":"Starter learning Python", "author":"Kivi"} 
>>> book(**bars) 
Kivi is writing Starter learning Python 





这 种 调用 函数 传 值 的 方式 很 少 用 到 ， 至 少 在 我 的 编程 实践 中 用 得 不 
多 ， 但 不 代表 读者 不 用 ， 这 或 许 是 习惯 问题 。 


Python 中 冰 数 的 参数 通过 赋值 的 方式 来 传递 引用 对 象 。 下 面 总 结 种 


见 的 函数 参数 定义 方式 ， 来 理解 参数 传递 的 流程 。 


def foo(p1, p2, p3,...) 








这 种 方式 最 第 见 了 ， 列 出 有 限 个 数 的 参数 ， 并 且 彼 此 之 间 用 逗号 隔 
开 。 在 调用 函数 的 时 候 ， 按 照 顺序 对 参数 进行 赋值 ， 特 别 要 注音 的 是 ， 
参数 的 名 字 不 重要 ， 重 要 的 是 位 置 。 而 且 ， 必 须 数量 一 致 ， 一 一 对 应 。 
第 一 个 对 象 〈 可 能 是 数值 、 字 符 串 等 ) 对 应 第 一 个 参数 ， 第 二 个 对 象 对 
应 第 二 个 参数 ， 如 此 对 应 ， 不 得 侦 磊 也 不 得 侦 右 。 


>>> def foo(p1，p2，p3): 
print "pi==>",p1 
print "p2==>",p2 
print "p3==>",p3 


>>> foo("python", 1, ["qiwsir","github","io"]) 
pi==> python 

p2==> 1 

p3==> ['gqiwsir', 'github', 'io'] 


>>> foo("python") 

Traceback (most recent call last): 
File "<stdin>", line 1, in <module> 

TypeError: foo() takes exactly 3 arguments (1 given) # 注 意 看 报错 信息 








>>> foo("python", 1, 2, 3) 
Traceback (most recent call last): 
File "<stdin>", line 1, in <module> 
TypeError: foo() takes exactly 3 arguments (4 given) 


def foo(p1=value1，p2=value2,...) 





这 种 方式 要 求 把 参数 和 值 都 写 上 ， 貌 似 这 样 就 不 乱 了 ， 很 明确 呀 ， 
颇 有 一 个 萝卜 对 着 一 个 坑 的 意味 。 


还 以 前 面 的 函数 为 例 ， 用 下 面 的 方式 赋值 就 不 用 担心 顺序 问题 了 。 





>>> foo(p3=3，p1=10，p2=222) 
p1==> 10 

p2==> 222 

p3==> 3 


还 可 以 用 类 似 下 面 的 方式 ， 部 分 参数 给 予 默认 的 值 。 





>>> def foo(p1，p2=22，p3=33): # 设 置 了 两 个 参数 




















p2， p3 的 默认 值 


print "pi==>", pl 
print "p2==>", p2 
print "p3==>", p3 











>>> foo(11) #p1=11， 其 他 的 参数 为 默认 赋值 





p1==> 11 
p2==> 22 
p3==> 33 


>>> foo(11, 222) # 按 照 顺序 ， 


p2=222， 

















p3 依 旧 维持 原 默 认 值 


p1==> 11 
p2==> 222 
p3==> 33 
>>> foo(11，222，333) 
p1==> 11 
p2==> 222 
p3==> 333 


>>> foo(11, p2=122) 
p1==> 11 
p2==> 122 
p3==> 33 





>>> foo(p2=122) #p1 没 有 默认 值 ， 必 须要 赋值 的 ， 否 则 报错 


Traceback (most recent call last): 
File "<stdin>", line 1, in <module> 
TypeError: foo() takes at least 1 argument (1 given) 


def foo(*args) 





这 种 方式 适合 于 不 确定 参数 个 数 的 时 候 ， 在 参数 args 前 面 加 一 个 *， 
注意 ， 仅 加 一 个 。 


>>> def foo(*args ) : 


print args 
>>> foo("qiwsir.github.Io") 
('dqiwsir,github.io'，) 
>>> foo("dqiwsir.github.1Io"，"python'") 
('gdiwsir.github.io', "python ') 


def foo(**args) 


这 种 方式 跟 上 面 的 区 别 在 于 ， 必 须 接 收 类 似 arg=val 的 形式 。 


>>> def foo(**args): 
print args 


>>> foo(1, 2, 3) # 这 样 就 报错 了 


Traceback (most recent call last): 
File "<stdin>", line 1, in <module> 
TypeError: foo() takes exactly 0 arguments (3 given) 


>>> foo(a=1, b=2, c=3) 


{'as 1 "C's.3 bs 2} 


下 面 写 一 个 综合 的 ， 看 看 以 上 四 种 参数 传递 方法 的 执行 顺序 。 


>>> def foo(x,y=2, *targs, **dargs): 


print "x==>", x 
print "y==>", y 
print "targs_tuple==>", targs 
print "dargs dict==>", dargs 


>>> foo("1x") 
X==> 1x 

y==> 二 
targs_tuple==> () 
dargs_dict==> {} 


>>> foo("1x", "2y") 
X==> 1x 

y==> 2y 
targs_tuple==> () 
dargs_dict==> {} 


>>> foo("1x", "2y", "3t1", 3E2.) 
x==> 1x 

y==> 2y 

targs_tuple==> ('3t1', '3t2') 
dargs_dict==> {} 


>>> foo("1x", "2y", "3t1"; "3t2; d1i="4d1", d2="4d2") 
Xx==> 1x 

y==> 2y 

targs_tuple==> ('3t1', '3t2') 

dargs_dict==> {'d2': '4d2', 'di': '4d1i'} 


3.4 ”特殊 函数 


到 目前 为 止 ， 你 已 经 知道 怎么 写 一 个 函数 了 。 但 是 ， 从 “ 知 
道 ” 到 “做 到 ”还 有 很 长 的 距离 ， 要 自己 能 够 熟练 写 出 函数 ， 还 需要 读者 
找 机 会 多 练习 。 


在 Python 中 ， 除 了 自己 写 函数 之 外 ， 它 还 提供 了 一 些 特有 的 函数 ， 
比如 前 面 已 经 多 次 出 现 的 内 建 函 数 ， 还 有 茶 些 模块 中 的 函数 等 ， 但 是 ， 
看 了 这 里 要 说 的 特殊 函数 之 后 ， 你 的 确 会 感受 到 它们 的 不 一 样 ， 它 们 常 
常 被 认为 是 “函数 式 编 程 " 的 代表 。 








3.4.1 递归 

递归 不 是 函数 ， 而 是 一 种 思想 。 之 所 以 放 到 这 里 是 因为 在 函数 中 要 
用 到 ， 所 以 先行 说 明 此 思想 ， 然 后 讲述 几 个 特殊 函数 。 

什么 是 递归 ? 

递归 ， 见 递归 。 

这 是 对 “递归 ”最 精简 的 定义 。 还 可 以 用 另外 一 种 形式 定义 : 
从 前 有 座 山 ， 山 里 有 座 庙 ， 庙 里 有 个 老 和 疝 ， 正在 给 小 和 疝 讲 故 
Shs er 山里 有 座 庙 ， 庙 里 有 个 老 和 疝 ， 正在 
给 小 和 尚 讲 故 事 。 a 山里 有 座 庙 ， 庙 里 有 个 

老 和 尚 ， 正 在 给 小 和 尚 讲 故 事 。 故 事 是 什么 呢 ?...... 


如 末 用 上 面 的 内 容 做 递归 的 定义 ， 总 感 党 有 点 调 候 ， 来 个 严肃 的 
〈 选 自 维基 百科 ) : 


递归 (英语 : Recursion) ， 又 译 为 递 回 ， 在 数学 与 计算 机 科学 中 ， 
是 指 在 函数 的 定义 中 使 用 函数 自身 的 方法 。 

















最 典型 的 递归 例子 之 一 是 斐 波 那 契 数列 。 


根据 非 波 那 旭 数 列 的 定义 ， 可 以 直接 写成 这 样 的 斐 波 那 契 数列 递归 
函数 。 

#!/UsSr/bin/env python 

# coding=utf-8 


def fib(n): 
if n==0: 


return fib(n-1) + fib(n-2) 


if name == "” main " 
f = fib(10) 
print f 





把 上 述 代码 保存 。 这 个 代码 的 意图 是 要 得 到 n=10 的 值 。 运 行 
$ python 20401.py 
55 
fib (n-1〉+fib (Cn-2) 就 是 又 调用 了 这 个 函数 目 己 ， 实 现 递归 。 为 
了 明确 递归 的 过 程 ， 下 面 走 一 个 计算 过 程 〈 考 虑 到 次 数 不 能 太 多 ， 束 让 
n=3) 。 
1.n=3，fib (3) ， 自 然 要 走 return fib (3-1) +fib (3-2) 分 支 。 


2. 先 看 fib (3-1) ， 即 fib (2) 也 要 走 else 分 文 ， 于 是 计算 fib (2- 
1) +fib (2-2) 。 


3.fib 〈2-1) 即 fib (1) ， 在 函数 中 束 要 走 elif 分 文 ， 返 回 1， 即 
fib (2-1) =1。 同 理 ， 容 易 得 到 fib (2-2) =0。 将 这 两 个 值 返回 到 上 面 一 
步 。 得 到 fib (3-1) =1+0=1。 


4. 再 计算 fib (3-2) ， 就 简单 了 一 些 ， 返 回 的 值 是 1， 即 fib (3-2) 








5. 最 后 计算 第 一 步 中 的 结果 : fib (3-1) +fib (3-2) =1+1=2， 将 计 
算 结果 2 作为 返回 值 。 


从 而 得 到 fib (3) 的 结果 是 2。 


从 上 面 的 过 程 中 可 以 看 出 ， 每 个 递归 的 过 程 都 是 器 着 最 初 的 已 知 条 
件 a0=0 和 al=1 方 癌 插 进一步 ， 直 到 通过 这 个 最 底层 的 条 件 得 到 结果 ， 然 
后 再 一 层 一 层 向 上 回馈 计算 结果 。 


其 实 ， 上 面 的 代码 有 一 个 问题 。 因 为 a0=0、al=1 是 已 知 的 了 ， 不 需 
要 每 次 都 判断 一 边 。 所 以 ， 还 可 以 优化 一 下 ， 优 化 的 基本 方案 就 是 初始 
化 最 初 的 两 个 值 。 











#!/UsSr/bin/env python 
# coding=utf-8 


meno = {0:0, 1:1} # 初 始 化 


def fib(n): 
if not n in meno: 
meno[n] = fib(n-1) + fib(n-2) 
return meno[n] 


if name == "main " 
f = fib(10) 
print f 

# 运 行 结果 








$ python 20402.py 
55 


以 上 实现 了 递归 ， 但 是 ， 至 少 在 Python 中 ， 递 归 要 慎重 使 用 。 因 为 
在 一 般 情况 下 ， 递 归 是 能 够 被 迭代 或 者 循环 替代 的 ， 而 且 后 者 的 效率 党 
常 比 递归 要 高 。 所 以 ， 我 的 个 人 建议 是 ， 对 使 用 递归 要 考虑 周密 ， 不 小 
心 就 会 永远 运行 下 去 。 


3.4.2” 几 个 特殊 函数 
特殊 函数 的 特殊 在 于 跟 * 函 数 式 编程 ? 扯 上 了 关系 。 


如 果 以 前 没有 听 过 ， 等 你 开始 进入 编程 界 ， 也 会 经 常 听 人 说 < 函数 
式 编程 "~、“ 面 向 对 象 编程 “指令 式 编程 "等 术语 。 它 们 是 什么 呢 ? 这 





个 话题 要 从 “编程 范式 ” 讲 起 。〔 以 下 内 容 源 目 维 基 百 科 ) 


编程 范 型 或 编程 范式 (英语 : Programming paradigm 范 即 模范 之 
意 ， 范 式 即 模式 、 方 法 ) ， 是 一 类 典型 的 编程 风格 ， 是 指 从 事 软件 工程 
的 一 类 典型 的 风格 (可 以 对 照 方法 学 ) 。 如 : 函数 式 编程 、 程 序 编程 、 
面向 对 象 编程 、 指 令 式 编程 等 为 不 同 的 编程 范 型 。 


编程 范 型 提供 了 《同时 决定 了 ) 程序 员 对 程序 执行 的 看 法 。 例 如 ， 
在 面 癌 对象 编程 中 ， 程 序 员 认为 程序 是 一 系列 相互 作用 的 对 象 ， 而 在 函 
数 式 编程 中 一 个 程序 会 锌 看 作 是 一 个 无 状态 的 函数 计算 的 串 行 。 


正如 软件 工程 中 不 同 的 群体 会 提倡 不 同 的 “方法 学 ”一 样 ， 不 同 的 编 
程 语言 也 会 提倡 不 同 的 “编程 范 型 *。 一 些 语言 是 专门 为 某 个 特定 的 范 型 
设计 的 《如 Smalltalk 和 Java 支 持 面 同 对 象 编程 ， 而 Haskell 和 Scheme 则 支 
持 函 数 式 编程 ) ， 同 时 还 有 另外 一 些 语言 文 持 多 种 范 型 〈 如 Ruby、 
Common Lisp、Python 和 Oz) 。 


编程 范 型 和 编程 语言 之 间 的 关系 十 分 复杂 ， 由 于 一 个 编程 语言 可 以 
文 持 多 种 范 型 。 例 如 ，C++ 设 计时 ， 文 持 过 程 化 编程 、 面 问 对 象 编程 以 
及 泛 型 编程 。 然 而 ， 设 计 师 和 程序 员 们 要 考虑 如 何 使 用 这 些 范 型 元 系 来 
构建 一 个 程序 。 一 个 人 可 以 用 C++ 写 出 一 个 完全 过 程 化 的 程序 ， 为 一 个 
人 也 可 以 用 C++ 写 出 一 个 纯粹 的 面向 对 象 程 计 ， 甚 至 还 有 人 可 以 写 出 杂 
灶 了 两 种 范 型 的 程序 。 


建议 读者 将 上 面 这 段 话 认真 读 完 ， 不 管 是 理解 还 是 不 理解 ， 总 能 有 
点 感觉 的 


正如 前 面 引文 中 所 说 的 ，Python 是 文 持 多 种 范 型 的 语言 ， 可 以 进行 
所 谓 的 函数 式 编 程 ， 其 突出 体现 在 有 这 么 几 个 函数 : 
































filter、map、reduce、lambda、yield 


有 了 它们 ， 最 大 的 好 处 是 程序 更 简洁 ;没有 它们 ， 程 序 也 可 以 用 别 
的 方式 实现 ， 只 不 过 可 能 要 多 写 几 行 喷 了 。 上 所 以 ， 还 是 能 用 则 用 之 吧 。 
更 何况 ， 恰 当地 使 用 这 几 个 函数 ， 能 让 别人 感觉 你 更 牛 。( 注 : 本 市 不 
对 yield 进 行 介绍 ， 后 面 介绍 。) 











1.lambda 


lambda 哨 数 是 一 个 只 用 一 行 束 能 解决 问题 的 函数 ， 听 着 是 多 么 诱 人 
呀 。 看 下 面 的 例子 : 


>>> def add(x) : 
Sa x += 3 
return x 





>>> numbers = range(10) 
>>> numbers 
[0, 1, 2, 3, 4, 5, 6, 7, 8, 9] 


>>> new_numbers = [] 
>>> for i in numbers: 
new_numbers.append(add(i)) #i 调 用 


add() 函 数 ， 并 
append 到 


1ist 中 


>>> new_numbers 
[3, 4, 5, 6, 7, 8, 9, 10, 11, 12] 


在 这 个 例子 中 ，add0 只 是 一 个 中 间 操 作 。 当 然 ， 上 面 的 例子 完全 可 
以 用 别 的 方式 实现 。 比 如 : 


>>> new_numbers = [ i+3 for i in numbers ] 
>>> new_numbers 
[3, 4, 5, 6, 7, 8, 9, 10, 11, 12] 


首先 说 明 ， 这 种 列表 解析 的 方式 是 非常 好 的 。 


但 是 ， 我 们 偏偏 要 用 lambda 这 个 函数 蔡 代 add (x) ， 如 果 你 和 我 一 
样 这 么 偏执 ， 束 可 以 : 


>>> lam = lambda x: x+ 3 

>>> n2 = [] 

>>> for i in numbers: 
n2.append(lam(i)) 

>>> n2 

[3, 4, 5, 6, 7, 8, 9, 10, 11, 12] 


这 里 的 lam 就 相当 于 add (x) ， 请 对 应 一 下 ， 这 一 行 lambda x:x+3 束 
完成 add (x) 的 三 行 ， 特 别 是 最 后 返回 值 。 还 可 以 写 这 样 的 例子 : 


>>> g = lambda x,y:x+y 
>>> g(3,4) 

7 

>>> (lambda x:x**2)(4) 
16 


通过 上 面 的 例子 ， 总 结 一 下 lambda 函 数 的 使 用 方法 : 

在 lambda 后 面 直 接 跟 变量 。 

变量 后 面 是 冒号 。 

。 冒号 后 面 是 表达 式 ， 表 达 式 计算 结果 就 是 本 函数 的 返回 值 。 
为 了 简明 扼要 ， 用 一 个 式 子 表示 是 必要 的 : 














lambda arg1, arg2, ...argN : expression using arguments 


要 特别 提醒 读者 :虽然 lambda 函 数 可 以 接收 任意 多 个 参数 包括 可 
选 参数 ) 并 且 返 回 单个 表达 式 的 值 ， 但 是 lambda 函 数 不 能 包含 命令 ， 包 
含 的 表达 式 不 能 超过 一 个 。 不 要 试图 癌 lambda 函 数 中 竖 入 太 多 的 东西 ; 
和 


束 lambda 而 襄 ， 它 并 没有 给 程序 市 来 性 能 上 的 提升 ， 但 带 来 的 是 代 
码 的 简洁 。 比 如 ， 要 打印 一 个 list， 里 面 依次 是 某 个 数字 的 1 次 方 、 二 次 
方 、 三 次 方 、 四 次 方 。 用 lambda 可 以 这 样 做 : 

>>> lamb = [ lambda x:x, lambda x:x**2, lambda x:x**3, lambda x:x**4 ] 


>>> for i in lamb: 
print i(3), 


39 27 81 





lambda 作 为 一 个 单行 的 函数 ， 在 编程 实践 中 可 以 选择 使 用 。 


2.map 
先 看 一 个 例子 ， 还 是 上 面 讲述 lambda 时 的 第 一 个 例子 ， 用 map 也 能 





够 实现 : 


>>> numbers 
[0, 1, 2, 3, 4, 5, 6, 7, 8, 9] 
>>> map(add, numbers) # 只 引用 函数 名 称 























add 即 可 


[3, 4, 5, 6, 7, 8, 9, 10, 11, 12] 














>>> map(lambda x: x+3, numbers) # 用 


1ambda 当 然 可 以 啦 





[3, 4, 5, 6, 7, 8, 9, 10, 11, 12] 


map0 是 Python 的 一 个 内 置 函 数 ， 它 的 基本 样式 是 : 


map(func, seq) 





func 是 一 个 函数 ，seq 是 一 个 序列 对 象 。 在 执行 的 时 候 ， 序 列 对 象 中 
的 每 个 元 素 ， 按 照 从 左 到 右 的 顺序 依次 被 取出 来 ， 竖 入 到 func 函 数 里 
面 ， 并 将 func 的 返回 值 依次 存 到 一 个 列表 中 。 


在 应 用 中 ，map 所 能 实现 的 也 可 以 用 别 的 方式 实现 。 比 如 : 





>>> items = [1, 2, 3, 4, 5] 

>>> squared = [] 

>>> for i in items: 
squared.append(i**2) 


>>> squared 
[1, 4, 9, 16, 25] 


>>> def sqr(x): return x**2 


>>> map(sqr, items) 
[1, 4, 9, 16, 25] 


>>> map(lambda x: x**2, items) 
[1, 4, 9, 16, 25] 











>>> [ x**2 for x in items ] # 这 个 我 最 喜欢 了 ， 速 度 快 ， 可 读 性 强 





[1, 4, 9, 16, 25] 





条 条 大 路 通 罗 马 ， 在 编程 中 ， 以 上 方法 自己 根据 需要 来 选用 。 
在 以 上 感性 认识 的 基础 上 ， 再 来 阅读 map0) 的 官方 说 明 ， 能 够 更 明 


Es 
map (function, iterable, ...) 


Apply function to every item of iterable and return a list of the results.If 
additional iterable arguments are passed, function must take that many 
arguments and is applied to the items from all iterables in parallel.If one 
iterable is shorter than another it is assumed to be extended with None 
items.If function is None, the identity function is assumed;if there are 
multiple arguments, map()returns a list consisting of tuples containing the 
corresponding items from all iterables (a kind of transpose operation) .The 
iterable arguments may be a sequence or any iterable object;the result is 
always a list. 


理解 要 点 : 


。 对 iterable 中 的 每 个 元 素 ， 依 次 应 用 function 的 方法 (函数 ) (这 本 
质 上 就 是 一 个 for 循 环 ) 。 

。 将 所 有 结果 返回 一 个 列表 。 

。 如 果 参 数 很 多 ， 则 对 那些 参数 并 行 执行 function 。 


例如 : 


>>> lst1 = [1,2,3,4,5] 

>>> lst2 = [6,7,8,9,0] 

>>> map(lambda x, y: x+y, lst1, lst2) 
[7, 9, 11, 13, 5] 





请 读者 注意 了 ， 上 和 面 这 个 例子 如 果 用 for 人 循环 来 写 ， 还 不 是 很 难 ， 如 
果 扩 展 一 下 ， 下 面 的 例子 用 for 来 改写 ， 就 要 小 心 了 : 





>>> lst1 = [1,2,3,4,5] 

>>> lst2 = [6,7,8,9,0] 

>>> lst3 = [7,8,9,2,1] 

>>> map(lambda x, y, Zz: x+ty+z, lst1, lst2, lst3) 
[14, 17, 20, 15, 6] 


这 才 显 示 出 map 的 简洁 优雅 。 


reduce 


直接 看 这 个 : 


>>> reduce(lambda x, y : x+y, [1, 2, 3, 4, 5]) 
15 


请 仔细 观察 ， 是 人 否 能 够 看 出 如 何 运 算 的 呢 ? 如 图 3-2 所 示 。 


图 3-2 ”运算 图 


对 比 一 下 map0 的 运算 ， 能 更 理解 reduce()。Map0) 是 上 下 运算 ， 
reduce() 是 横着 逐个 元 素 进行 运算 。 


权威 的 解释 来 自 官 网 : 











reduce (function, iterable[, initializer]) 


Apply function of two arguments cumulatively to the items of iterable, 
from left to right, so as to reduce the iterable to a single value.For 
example, reduce (lambda x, y:xty, [1, 2, 3, 4,，5]) 
calculates ( ( ( (1+2) +3) +4) +5) .The left argument, x, is the 
accumulated value and the right argument, y, is the update value from the 
iterable.If the optional initializer is present, itis placed before the items of 
the iterable in the calculation, and serves as a default when the iterable is 
empty.If initializer is not given and iterable contains only one item, the first 
item is returned.Roughly equivalent to: 


def reduce(function, iterable, initializer=None): 
it = iter(iterable) 
if initializer is None: 
try: 
initializer = next(it) 
except StopIteration: 
raise TypeError('reduce() of empty sequence with no initial value') 
accum value = initializer 
for x in it: 
accum_value = function(accum_value, x) 
return accum_value 


如 果 用 我 们 熟悉 的 for 循 环 来 做 上 面 reduce 的 事情 ， 可 以 这 样 来 做 : 


>>> lst = range(1, 6) 


>>> lst 

[1, 2, 3, 4, 5] 

>>> r=0 

>>> for i in range(len(1st)): 
i r += lst[i] 

>>> r 

15 


for 是 普 适 的 ，reduce 是 简洁 的 。 


为 了 锻炼 思维 ， 看 这 么 一 个 问题 ， 有 两 个 list， a=[3， 9， 8， D， 
2]，b=[1，4，9，2，6]， 计 算 : a[0]*b[0]+a[1]*b[1]+... 的 结果 。 


>>> a 
[3, 9, 8, 5, 2] 
>>> b 
[1, 4, 9, 2, 6] 


>>> zip(a ,b) 
[(3, 1), (9, 4), (8, 9), (5, 2), (2, 6)] 


>>> sum(x*y for x, y in zip(a, b)) # 解 析 后 直接 求 和 























133 











>>> new_list = [x*y for x, y in zip(a，b)]  # 可 以 看 作 是 上 面 方法 的 分 步 实施 














>>> # 这 样 解析 也 可 以 : 





new_tuple = (x*y for x, y in zip(a, b)) 
>>> new_list 

[3, 36, 72, 10, 12] 

>>> sum(new_ list) # 或 者 





:sum(new_tuple) 
133 








>>> reduce(lambda sum, (x, y): sum + x*y, zip(a,b), 9) # 这 个 方法 是 在 要 酷 呢 吗 ? 


133 





>>> from operator import add, mul # 贡 酷 的 方法 也 不 止 一 个 


>>> reduce(add,map(mul,a,b)) 
133 


>>> reduce(lambda x,y: x+y, map(lambda x,y: x*y, a,b)) #map,reduce,lambda 都 齐全 了 





133 


如 果 读 者 使 用 的 是 Python 3， 会 跟 上 面 有 点 儿 不 一 样 ， 因 为 在 
Python 3 中 ，reduce0O 已 经 从 全 局 命名 空间 中 移 除 ， 放 到 了 functools 模 块 
中 ， 如 果 要 是 用 ， 需 要 用 from functools import reduce 引 入 之 。 


3.filter 


filter 的 中 文 舍 义 是 “过 涯 器 ”， 在 Python 中 ， 它 起 到 了 过 滤器 的 作 
用 。 官 方 文档 中 这 么 说 : 





filter (function, iterable) 


Construct a list from those elements of iterable for which function 
returns true.iterable may be either a sequence, a container which supports 
iteration, or an iterator.If iterable is a string or a tuple, the result also has 
that type;otherwise it is always a list.If function is None, the identity 
function is assumed, thatis, all elements of iterable that are false are 
removed. 


Note that filter (function, iterable) is equivalent to[item for item in 
iterable if function (item) |if function is not None and[item for item in 
iterable if item|lif function is None. 





这 次 真 的 不 翻译 了 ， 而 且 也 不 解释 要 点 了 。 请 读者 务必 目 己 阅读 上 
面 的 文字 ， 并 且 理 解 其 含义 。 


通过 下 面 的 程序 代码 体会 : 


>>> numbers = range(-5，5) 
>>> numbers 
[-5， -4, -3， -2, = 了 0， 41; 2, 3, 4] 


>>> filter(lambda x: x>0, numbers) 


[1, 2, 3, 4] 

>>> [x for x in numbers if x>0] # 与 上 面 那 句 等 效 
[1, 2, 3, 4] 

>>> filter(lambda c: c!='i', 'dqiwsir') 

"qwSsr 


人 至此， 介绍 了 几 个 函数 ， 这 些 函 数 在 对 程序 的 性 能 提高 上 并 没有 时 
著 或 者 稳定 预期 ， 但 是 ， 在 代码 的 简洁 上 是 有 目 共 睹 的 。 有 时 候 可 以 用 
来 秀一 秀 ， 以 彰显 Python 的 优雅 ， 或 者 目 己 页 酷 。 如 何 用 及 怎么 用 ， 惑 
看 你 目 己 的 喜好 了 。 





3.5 “练习 


仅 仪 知道 了 函数 的 知识 是 远 远 不 够 的 ， 必 须要 勤 练习 、 多 敲 代码 ， 
ee 
练习。 


首先 声明 ， 以 下 对 每 个 问题 的 解决 方案 ， 不 一 定 是 最 优 的 。 如 果 读 
者 有 更 好 的 解决 方案 ， 可 以 分 享 〈 到 我 的 网 站 www.itdiffer.com 能 够 找到 
各 种 联系 我 的 方法 ) 。 


读者 完成 下 面 的 练习 ， 请 遵守 如 下 规则 《全 看 你 的 目 我 控制 能 力 
了 ， 上 自控 能 力 强 的 胜出 ， 不 要 欺骗 哦 ， 因 为 上 节 在 看 着 你 呢 〉: 


I 古 合 
正确 。 
。 也 给 出 了 参考 代码 ， 但 是 ， 参 考 代 码 并 不 是 最 终结 末 。 


。 可 以 在 上 述 基 础 上 对 代码 进行 完善 。 
。 如 末 读 者 愿意 ， 可 以 将 代码 提交 到 github 上 跟 大 家 分 享 。 








351 储 二 元 二 侈 方程 





解 一 元 二 次 方程 是 初中 数学 中 的 基本 知识 ， 一 般 来 讲解 法 有 公式 
ee 
旦 的 程序 。 


最 简单 的 思路 就 是 用 公式 法 求解 ， 这 是 普 适 法 则 。 


古巴 比 伦 留 下 的 陶 片 显示 ， 在 大 约 公 元 前 2000 年 (2000 BC) 古巴 
比 伦 的 数学 家 就 能 解 一 元 二 次 方程 了 。 在 大 约 公 元 前 480 年 ， 中 国人 已 
经 使 用 配方 法 求 得 了 二 次 方程 的 正 根 ， 但 是 并 没有 提出 通用 的 求解 方 
ee 
次 方程 。 














7 世纪 印度 的 婆罗 摩 笈 多 〈Brahmagupta) 是 第 一 位 懂得 使 用 代数 方 
程 的 人 ， 同 时 容许 方程 有 正 负 数 的 根 。 


11 世 纪 阿 拉 伯 的 花 拉 子 密 独 立地 发 展 了 一 套 公式 以 求 方程 的 正 数 
解 。 亚 伯 拉 和 军 : 巴 希 亚 〈 亦 以 拉丁 文 名 字 陕 瓦 索 达 和 著称 ) 在 他 的 著作 
《Liber embadorum》 中 ， 首 次 将 完整 的 一 元 二 次 方程 解法 传 入 欧洲 。 
( 源 自 《 维 基 百 科 》) 


参考 代码 : 











#!/UsSr/bin/env python 
# coding=utf-8 


solving a quadratic equation 


from __future _ import division 
import math 


def quadratic_ equation(a,b,c): 
delta =b*b- 


4 *a * C 

if delta < 0: 
return False 

elif delta == 0: 
return -(b/ (2 * a)) 

else: 
sqrt_delta = math.sqrt(delta) 
x1 = (-b + sqrt_delta) / (2 * a) 
x2 = (-b - sqrt_delta) / (2 * a) 
return xi, x2 


if name == ”main ": 
print "a quadratic equation: XA2 + 2x+1=0" 
coefficients = (1, 2, 1) 
roots = quadratic equation(*coefficients) 
if roots: 
print "the result is:", roots 
else: 
print "this equation has no solution." 





保存 为 20501.py， 并 运行 之 : 


$ python 20501.py 
a duadratic equation: x^2 + 2x+1=0 
the result is: -1.0 


能 够 正常 运行 ， 求 解 方程 。 








但 是 ， 如 果 再 认真 思考 ， 会 发 现 上 述 代码 是 有 很 大 改进 空间 的 : 


1. 如 果 不 小 心 将 第 一 个 系数 〈a) 的 值 输 入 了 0， 程 序 肯 定 会 报错 。 
如 何 避 免 之 ? 要 记 住 ， 任 何人 的 输入 都 是 不 可 靠 的 。 


2. 结 果 貌 似 只 能 是 小 数 ， 这 在 菜 些 情况 下 是 近似 值 ， 能 不 能 得 到 以 
分 数 形式 表示 的 精确 结果 呢 ? 


3. 复 数 ，Python 是 可 以 表示 复数 的 ， 如 果 delta<0， 是 不 是 写成 复数 














更 好 


读者 是 否 还 有 其 他 改进 呢 ? 你 能 不 能 进行 改进 ， 然 后 跟 我 和 其 他 朋 
友 一 起 来 分 享 你 的 成 就 呢 ? 


至 少 要 完成 上 述 改进 ， 可 能 需要 其 他 有 关 Python 的 知识 ， 甚 至 于 前 
面 没 有 介绍 。 这 都 不 要 紧 ， 掌 握 了 基本 知识 之 后 ， 在 编程 的 过 程 中 ， 吾 
要 不 断 发 挥 google 搜 索 的 优势 ， 让 它 帮助 你 找寻 完成 任务 的 工具 。 


Python 是 一 个 开发 的 语言 ， 很 多 大 牛人 都 号 了 一 些 工具 让 别人 使 
用 ， 减 轻 了 后 人 的 荔 动 负担 ， 这 束 是 所 谓 的 第 三 方 模块 。 虽 然 Python 中 
己 经 有 一 些 “ 目 带电 池 ”， 即 默认 安装 ， 比 如 上 面 程序 中 用 到 的 math， 但 
是 我 们 还 嫌 不 够 。 于 是 有 很 多 第 三 方 的 模块 来 专门 解决 茶 个 问题 。 比 
A 问题 就 可 以 使 用 SymPy 来 解决 ， 当 然 NumPy 也 是 非常 强 
悍 的 工具 。 























3.5.2 ”统计 考试 成 绩 





每 次 考试 之 后 ， 教 师 都 要 统计 考试 成 绩 ， 一 般 包 括 : 平均 分 ， 以 及 
对 所 有 人 按 成 绩 从 高 到 低 排队 ， 谁 成 绩 最 好 ， 谁 成 绩 最 差 等 。 下 面 的 任 
务 就 是 读者 转动 脑筋 ， 思 考 如 何 用 程序 实现 考试 成 绩 统 计 。 为 了 简化 ， 
以 字典 形式 表示 考试 成 绩 记 录 ， 例 如 ， 
{"zhangsan":90，"lisi":78，"wangermazi":39}， 当 然 ， 也 许 不 止 这 三 项 ， 
每 个 老师 所 处 理 的 内 容 都 稍 有 不 同 ， 因 此 字典 里 的 键 值 对 也 不 一 样 。 


怎么 做 ? 





有 几 种 可 能 要 考 碟 到 : 








。 最 高 分 或 者 最 低 分 ， 可 能 有 人 并 列 。 
。 要 实现 不 同 长 度 的 字典 作为 输入 值 。 


。 输出 结果 中 ， 除 了 平均 分 ， 


其 他 的 都 要 有 姓名 和 分 数 两 项 ， 否 则 都 





匿名 了 ， 怎 么 刺 沿 学 演 、 表 扬 学 霸 呢 ? 





不 管 你 是 学 漆 还 是 学 钳 ， 痢 


的 程序 ， 调 试 之 后 再 阅读 下 文 。 
参考 代码 : 


能 学 好 Python。 请 思考 后 敲 代 码 调试 你 


#!/UsSr/bin/env python 


# coding=utf-8 


统计 考试 成 绩 


TEN TY 
from future_ import division 


def average_ score(scores): 


统计 平均 分 


score_values = scores.values() 
sum_scores = sum(score_values) 


average = sum_ scores / len(score_values) 


return average 


def sorted_score(scores): 


对 成 绩 从 高 到 低 排 队 


score_lst = [(scores[k], k) for 


k in scores] 


sort_lst = sorted(score_ lst, reverse=True) 
return [(i[1], i[0]) for i in sort_lst] 


def max_score(scores): 


成 绩 最 高 的 姓名 和 分 数 





lst = sorted_ score(scores) 











# 马 





分 数 排序 的 函数 





sorted_score 

max_score = lst[0][1] 

return [(i[0], i[1]) for i in lst if i[1] == max_scorel] 
def min_score(scores): 


成 绩 最 低 的 姓名 和 分 数 





lst = sorted_ score(scores) 

min_score = lst[len(lst)-1][1] 

return [(i[0],i[1]) for i in lst if i[1]==min_scorel] 
if name == ”main ": 
examine_scores = {"google":98, "facebook":99, "baidu":52, "alibaba":80, "yahoo" 





ave = average_score(examine_scores) 
print "the average score is: ", ave # 平 均 分 


sor = sorted_ score(examine_scores) 
print "list of the Scores: ",sor # 成 绩 表 


xueba = max_score(examine_scores) 
print "Xueba is: ",xueba # 学 堪 们 


Xuezha = min_score(examine_scores) 
print "Xuzha is: ",xuezha # 学 漆 们 


保存 为 20502.py， 然 后 运行 : 


$ python 20502 .py 

the average Score is: 80.2222222222 

list of the Scores: [('facebook', 99), ('apple', 99), ('amazon', 99), ('google', 9 
Xueba is: [('facebook', 99), ('apple', 99), ('amazon', 99)] 

Xuzha is: [('yahoo', 49)] 


貌似 结果 还 不 错 。 不 过 ， 还 有 改进 余地 ， 看 看 现实 就 感觉 不 怎么 友 
好 了 。 能 不 能 优化 一 下 ? 当然 ， 里面 的 函数 也 不 一 定 是 最 好 的 方法 ， 你 
也 可 以 修改 优化 。 


3.5.3” 找 质数 


这 是 一 个 比较 冲 见 的 题目 。 我 们 姑且 将 范围 缩小 一 下 ， 找 出 100 以 
内 的 素数 吧 。 


还 是 按照 前 面 的 惯例 ， 读 者 先 做 ， 然 后 我 提供 参考 代码 ， 最 后 优 


质数 (Prime number) ， 又 称 素数 ， 指 在 大 于 1 的 上 自然数 中 ， 除 了 1 
和 此 整数 自身 外 ， 无 法 被 其 他 目 然 数 整除 的 数 〈 也 可 定义 为 只 有 1 和 本 
身 两 个 因数 的 数 ) 。 


哥 德 巴赫 猜想 是 数论 中 存在 最 久 的 未 解 问题 之 一 。 这 个 猜想 最 早出 
现在 1742 年 普鲁士 人 死 里 斯 带 安 ' 哥 德 巴 赫 与 瑞士 数学 家 莱 帅 哈 德 ' 欧 拉 
的 通信 中 。 可 以 用 现代 的 数学 语言 陈述 哥 德 巴赫 猜想 为 :“ 任 一 大 于 2 的 
偶数 ， 都 可 表示 成 两 个 质数 之 和 。”。 哥 德 巴赫 猜想 在 提出 后 的 很 长 一 
段 时 间 内 有 坚 无 进展 ， 直 到 20 世 纪 20 年 代 ， 数 学 家 从 组 合 数学 与 解析 数论 
两 方面 分 别提 出 了 解决 的 思路 ， 并 在 其 后 的 半 个 世纪 里 取得 了 一 系列 突 
破 。 目 前 最 好 的 结果 是 陈景润 在 1973 年 发 表 的 陈 氏 定理 (也 被 称 
为 “1+2”) 。( 源 自 《 维 基 百 科 》) 


对 这 个 练习 ， 我 的 思路 是 先 做 一 个 函数 ， 用 它 来 判断 某 个 整数 是 否 
是 质数 ， 然 后 循环 即 可 。 


参考 代码 : 





#!/Uusr/bin/env python 
# coding=utf-8 


寻找 质数 


import math 
def is_prime(n): 


判断 一 个 数 是 否 是 质数 


if n <= 1: 
return False 
for i in range(2, int(math.sqrt(n) + 1)): 
if n% i == 0: 
return False 
return True 


if name == " main _": 
primes = [i for i in range(2,100) if is_prime(i)] # 从 





2 开始 ， 


1 显然 不 是 质数 


print primes 


代码 保存 后 运行 : 


$ python 20503.p 
[2, 3, 5, 7, 11, 13, 17, 19, 23, 29, 31, 37, 41, 43, 47, 53, 59, 61, 67, 71, 73, 79 


打印 出 了 100 以 内 的 质数 。 


你 或 许 也 发 现 了 这 个 程序 需要 进一步 优化 的 地 方 ， 为 外 ， 关 于 判断 
0 
思路 。 





3.5.4 ”编写 函数 的 注意 事项 





编写 函数 ， 在 开 友 实践 中 是 非常 必要 和 常见 的 ， 一 般 情况 ， 你 写 的 
函数 应 该 是 : 


尽量 不 要 使 用 全 局 变量 。 

如 采 参 数 是 可 变 类 型 数据 ， 则 在 函数 内 不 要 修改 它 。 

每 个 函数 的 功能 和 目标 要 单纯 ， 不 要 试图 一 个 函数 做 很 多 事情 。 
函数 的 代码 行 数 尽量 少 。 

图 数 的 独立 性 越 强 越 好 ， 不 要 跟 其 他 的 外 部 东西 产生 关联 。 


下 2 才 厢 


随 看 学 习 的 深入 ， 你 一 定 体会 到 了 编程 的 乐趣 ， 同 样 也 越 来 越 多 地 
听 到 一 些 感觉 有 点 “莫名其妙” 的 名 词 ， 这 些 名 词 常常 是 对 “ 某 个 对 象 的 
行为 或 现状 ”的 概括 ， 这 种 概括 需要 学 习 者 用 “抽象 ”的 思维 方法 理解 。 


从 本 季 开 始 ， 我 们 将 共同 涉足 于 此 类 内 容 。“ 类 ”在 编程 中 不 断 被 用 
到 ， 所 以 ， 它 成 为 了 本 季 的 主角 。 本 季 中 其 他 内 容 都 是 对 第 1 季 知 识 的 
综合 应 用 ， 从 本 季 开 始 ， 你 所 痪 的 代码 就 越 来 越 接 近 于 开发 实践 了 。 上 自 
十 以 来 , “ 行 百 里 路 者 半 九 十 ”， 若 能 够 坚持 读 完 本 季 的 内 容 ， 那 么 在 
Python 语言 学 习 上 至 少 已 经 成 为 另外 的 10%。 























大 所 


第 4 章 类 


类 是 OOP 中 的 重要 概念 ， 也 是 学 习 Python 的 一 个 路 越 。 总 有 不 少 初 
学 者 ， 学 到 这 里 就 感到 迷惑 。 为 此 ， 建 议 学 习 者 从 本 章 开 始 一 边 看 书 一 
边 融 代码 ， 然 后 反复 推 融 ， 不 要 退 求 速度 ， 并 且 要 多 上 网 搜索 ， 理 解 其 
中 含义 。 最 终 的 胜利 是 属于 你 的 。 














”类 也 是 对 世界 的 抽象 结 末 ， 所 以 ， 读 者 还 要 注意 “抽象 思维 ”方法 在 
编程 中 的 应 用 。 如 何 才能 具有 “抽象 能力 呢 ? 一 两 句 话 还 说 不 好 ， 但 
是 ， 勤 于 练习 、 惯 于 思考 是 必须 的 。 





4.1 基本 概念 


类 ， 如 果 是 你 第 一 次 听 到 这 个 词 ， 那 么 把 它 作 为 一 个 单独 的 名 词 会 
感觉 怪 怪 的 ， 因 为 在 汉语 体系 中 ， 较 常见 的 是 “ 鸟 类 ”、“ 人 类 ”等 词语 ， 
而 单独 说 “类 ”， 总 感觉 前 面 缺 点 修饰 成 分 。 其 实 ， 它 对 应 的 是 英文 单词 
class, “类 ”是 由 class 翻 译 过 来 的 ， 你 就 把 它 作 为 一 个 翻译 术语 吧 ，。 








除了 “类 ”这 个 术语 外 ， 还 要 经 常 提 到 OOP， 即 面向 对 象 编程 (或 
者 “面向 对 象 程序 设计 ”) 。 


为 了 理解 类 和 OOP， 需 要 对 一 些 枯燥 的 名 词 有 所 了 解 。 


“ 行 百 里 路 者 半 九 十 ”， 如 果 读 者 坚持 阅读 到 本 书 的 这 个 章节 ， 已 经 
对 Python 有 了 初步 感受 ， 而 “类 ”就 是 能 够 让 你 在 Python 学 习 进 程 中 再 上 
台阶 的 标志 。 所 以 ， 一 定 要 便 着 头皮 耐心 阅读 下 去 。 


所 谓 “ 术 语 ”， 可 以 粗浅 地 理解 为 条 个 领域 的 “ 行 话 ”， 比 如 在 物理 学 
里 面 ， 有 专门 定义 的 “质量 “位 移 " 人 “速度 等， 这 些 术语 有 的 跟 日 党 
生活 中 的 俗称 名 字 貌 似 一 样 ， 但 是 所 指 有 所 不 同 。 


“术语 ”的 主要 特征 是 具有 一 定 的 稳定 性 ， 并 且 严 谨 、 简 明 ， 不 是 流 
行 语言 。 在 谈 到 OOP 的 时 候 束 会 遇 到 一 些 术语 ， 和 需要 先 明确 它们 的 含 
义 。 本 市 没有 特别 声明 的 术语 定义 均 来 自 维 基 百 科 。 

















4.1.1 问题 空间 

问题 空间 是 问题 解决 者 对 一 个 问题 所 达到 的 全 部 认识 状态 ， 它 是 由 
问题 解决 者 利用 问题 所 包含 的 信息 和 已 贮存 的 信息 主动 构成 的 。 

一 个 问题 一 般 从 以 下 三 个 方面 来 定义 : 
。 初始 状态 开始 时 不 完全 的 信息 或 令 人 不 满意 的 状况 。 








。 目标 状态 一 一 你 希望 获得 的 信息 或 状态 。 
。 操作 一 一 为 了 从 初始 状态 迈 问 目标 状态 ， 你 可 能 采取 的 步骤 。 


这 三 个 部 分 加 在 一 起 定义 了 问题 空间 (problem space) 。 








4.1.2 对象 


对 象 (object) ， 是 面向 对 象 (Object Oriented) 中 的 术语 ， 既 表示 
客观 世界 问题 空间 (Namespace) 中 的 某 个 具体 的 事物 ， 又 表示 软件 系 
统 解 空 间 中 的 基本 元 素 。 


把 object 翻 译 为 “对 象 * 是 比较 抽象 的 ， 因 此 ， 有 人 认为 ， 不 如 翻译 
为 “物件 ”更 好 ， 因 为 “物件 ”让 人 感到 一 种 具体 的 东西 。 


这 种 看 法 在 茶 些 语言 中 是 非常 适合 的 ， 但 是 在 Python 中 则 无 所 谓 ， 
不 管 怎样 ，Python 中 的 一 切 部 是 对 象 ， 不 管 是 字符 串 、 函 数 、 模 块 还 是 
类 都 是 对 象 , “万物 皆 对 象 ”。 


都 是 对 象 有 什么 优势 吗 ? 这 说 明 Python 天 生 就 是 OOP 的 。 也 说 明 
人 
组 合 应 用 的 。 


对 于 对 象 这 个 东西 ，OOP 大 师 Grandy Booch 的 定义 应 该 是 权威 的 ， 
相关 定义 的 内 容 如 下 。 


。 对 象 : 一 个 对 象 有 自己 的 状态 、 行 为 和 唯一 的 标识 ; 所 有 相同 类 型 
的 对 象 所 具有 的 结构 和 行为 在 它们 共同 的 类 中 被 定义 。 

。 状态 (state〉: 包括 这 个 对 象 已 有 的 属性 (通常 是 类 里 面 已 经 定义 
好 的 ) 和 对 象 具 有 的 当前 属性 值 (这些 属性 往往 是 动态 的 ) 。 

。 行为 (behavior) : 是 指 一 个 对 象 如 何 影响 外 界 及 被 外 界 影响 ， 表 
现 为 对 象 上 自身 状态 的 改变 和 信息 的 传递 。 

。 标识 〈identity) : 是 指 一 个 对 象 所 具有 的 区 别 于 所 有 其 他 对 象 的 属 
性 (本 质 上 指 内 存 中 所 创建 的 对 象 的 地 址 〉。 


大 师 的 话 的 确 有 水 平 ， 听 起 来 非常 高 深 。 不 过 ， 初 学 者 可 能 理解 起 
来 有 点 困难 ， 下 面 把 大 师 的 话 化 简 一 下 。 

















简化 之 ， 对 象 应 该 具有 属性 《就 是 上 面 的 状态 ， 因 为 属性 更 党 
用 ) 、 方 法 〈 融 是 上 面 的 行为 ， 方 法 常 被 使 用 ) 和 标识 。 因 为 标识 是 内 
存 中 目 动 完成 的 ， 所 以 ， 平 时 不 用 怎么 管理 它 ， 主 要 就 是 属性 和 方法 。 


为 了 体现 “深入 浅 出 ”的 道理 ， 下 面 讲 一 个 故事 。 


既然 万 物 者 是 对 象 ， 那 么 ， 茶 个 具体 的 人 也 是 对 象 。 假 设 以 某 
个 “ 王 美 女 ” 为 对 象 说 明 (这 个 王 美 女 完 全 是 虚构 的 ， 请 不 要 对 写 入 座 ， 
更 不 要 想入非非 ， 如 果 雷 同 ， 纯 属 巧合 ) 。 


“ 王 美女 ”这 个 对 象 具 有 某 些 特征 ， 眼 睛 ， 大 ; 腿 ， 长 ; 皮肤 ， 白 。 
当然 ， 既 然 是 美女 ， 肯 定 还 有 别 的 显明 特征 ， 读 者 可 以 自己 去 假设 。 如 
采用 “对 象 "的 术语 来 说 明 ， 就 说 这 些 特征 都 是 她 的 属性 ， 也 就 是 次 属性 
古 一 个 对 象 所 具有 的 特征 ， 或 日 : 是 什么 。 

“ 王 美 女 ” 除 了 具有 上 面 的 特征 之 外 ， 还 能 做 一 些 事情 ， 比 如 能 唱 
歌 、 会 吹 拉 弹唱 等 。 这 些 都 是 她 能 够 做 的 事情 。 用 “对 象 "的 术语 来 说 ， 
这 就 是 她 的 “方法 ”， 即 方法 就 是 对 象 能 够 做 什么 。 


任何 一 个 对 象 都 要 包括 这 两 部 分 : 属性 (是 什么 ) 和 方法 (能 做 什 

















4.1.3 面 癌 对 象 








面 癌 对象 ， 不 是 说 你 面 对 这 位 “ 王 美 女 ”， 是 指 程序 员 在 开发 程序 的 
时 候 要 怎么 思考 问题 ， 怎 么 构建 程序 的 事情 。 


面 同 对 象 程序 设计 (英语 : Objectroriented programming， 缩 写 : 
OOP) 是 一 种 程序 设计 范 型 ， 同 时 也 是 一 种 程序 开发 的 方法 。 对 象 指 的 
是 类 的 实例 ， 它 将 对 象 作 为 程序 的 基本 单元 ， 将 程序 和 数据 封装 其 中 ， 
以 提高 软件 的 重用 性 、 灵 活性 和 扩展 性 。 


面 问 对 象 程 序 设 计 可 以 看 作 是 一 种 在 程序 中 包含 各 种 独立 而 又 互相 
调用 的 对 象 的 思想 ， 这 与 传统 的 思想 刚好 相反 : 传统 的 程序 设计 主张 将 
程序 看 作 是 一 系列 函数 的 集合 ， 或 者 直接 就 是 一 系列 对 电脑 下 达 的 指 
令 。 面 癌 对 象 程序 设计 中 的 每 一 个 对 象 都 应 该 能 够 接受 数据 、 处 理 数据 











并 将 数据 传达 给 其 他 对 象 ， 因 此 它们 都 可 以 被 看 作 是 一 个 小 型 的 “机 
器 2”， 即 对 象 。 


目前 已 经 被 证 实 的 是 ， 面 问 对 象 程序 设 计 推 广 了 程序 的 灵活 性 和 可 
维护 性 ， 并 且 在 大 型 项 目 设 计 中 广 为 应 用 。 此 外 ， 文 持 者 声称 面 问 对 象 
程序 设计 要 比 以 往 的 做 法 更 加 便于 学 习 ， 因 为 它 能 够 让 人 们 更 简单 地 设 
计 并 维护 程序 ， 使 得 程序 更 加 便于 分 析 、 设 计 、 理 解 。 反 对 者 在 茶 些 领 
域 对 此 予以 否认 。 


当 我 们 提 到 面向 对 象 的 时 候 ， 它 不 仅 指 一 种 程序 设计 方法 ， 更 多 意 
义 上 是 一 种 程序 开发 方式 。 在 这 一 方面 ， 我 们 必须 了 解 更 多 关于 面向 对 
象 系统 分 析 和 面向 对 象 设 计 〈Object Oriented Design， 简 称 OOD ) 方面 
的 知识 。 


下 面 再 引用 一 段 来 和 目 维基 百科 中 关于 OOP 的 历史 。 为 什么 要 了 解 历 
史 ? 因为 历史 束 是 过 去 的 今天 ， 反 映 了 人 类 的 思维 发 展 过 程 。 


面 癌 对 象 程 序 设计 的 雏形 ， 早 在 1960 年 的 Simula 语 言 中 即 可 发 现 ， 
当时 的 程序 设计 领域 正面 临 着 一 种 危机 : 在 软 硬 件 环境 逐渐 复杂 的 情况 
下 ， 软 件 如 何 得 到 民 好 的 维护 ?面向 对 象 程序 设计 在 某 种 程度 上 通过 强 
调 可 重复 性 解决 了 这 一 问题 。20 世 纪 70 年 代 的 Smalltalk 语 言 在 面向 对 象 
方 i 
于 J 基 侧 |。 


计算 机 科学 中 对 象 和 实例 概念 的 最 早 萌 芽 可 以 追溯 到 态 省 理工 学 院 
的 PDP-1 系 统 。 这 一 系统 大 概 是 最 早 的 基于 容量 架构 (capability based 
architecture) 的 实际 系统 。 另 外 1963 年 Ivan Sutherland 的 Sketchpad 应 用 
中 也 强 含 了 同样 的 思想 。 对 象 作为 编程 实体 最 早 于 20 世 纪 60 年 代 由 
Simula 67 语 言 引 入 思维 。Simula 这 一 语言 是 奥 利 - 约 鞭 :达尔 和 克利 斯 登 - 
奈 加 特 在 挪威 奥斯陆 计算 机 中 心 为 模拟 环境 而 设计 的 〈 据 说， 他们 是 为 
了 模拟 船只 而 设计 的 这 种 语言 ， 并 且 对 不 同 舱 只 间 属 性 的 相互 影响 感 兴 
趣 。 他 们 将 不 同 的 船只 归纳 为 不 同 的 类 ， 而 每 一 个 对 象 ， 基 于 和 它 的 类 ， 
可 以 定义 它 自 己 的 属性 和 行为 ) 。 这 种 办 法 是 分 析 式 程序 的 最 早 概 念 体 
现 ， 在 分 析 式 程序 中 ， 我 们 将 真实 世界 的 对 象 映 射 到 抽象 的 对 象 叫 
作 “ 模 拟 *?。Simula 不 仅 引 入 了 “类 ”的 概念 ， 还 应 用 了 实例 这 一 思想 
这 可 能 是 这 些 概念 的 最 早 应 用 。 


20 世 纪 70 年 代 施 乐 PARC 研 究 所 发 明 的 Smalltalk 语 言 将 面 同 对 象 程 
































序 设计 的 概念 定义 为 : 在 基础 运算 中 ， 对 对 象 和 消息 的 广泛 应 用 。 
Smalltalk 的 创建 者 深 受 Simula 67 的 主要 思想 影响 ， 但 Smalltalk 中 的 对 象 
是 完全 动态 的 一 一 它们 可 以 被 创建 、 修 改 并 销毁 ， 这 与 Simula 中 的 静态 
对 象 有 所 区 别 。 此 外 ，Smalltalk 还 引入 了 继承 性 的 思想 ， 因 此 一 举 超越 
了 不 可 创建 实例 的 程序 设计 模型 和 不 具备 继承 性 的 Simula。 此 外 ， 
Simula 67 的 思想 亦 被 应 用 在 许多 不 同 的 语言 中 ， 如 Lisp、Pascal 。 


面向 对 象 程序 设计 在 20 世 纪 80 年 代 成 为 了 一 种 主导 思想 ， 这 主要 应 
归功 于 C++。 在 图 形 用 户 界面 (GUI) 日 渐 崛 起 的 情况 下 ， 面 向 对 象 程 
序 设 计 很 好 地 适应 了 漳 流 。GUI 和 面向 对 象 程序 设计 的 紧密 关联 在 Mac 
OS X 中 可 见 一 班 。Mac OS X 是 由 Objective-C 语 言 写成 的 ， 这 一 语言 是 
一 个 仿 Smalltalk 的 C 语 言 扩充 版 。 面 向 对 象 程 序 设计 的 思想 也 使 事件 处 
理 式 的 程序 设计 应 用 地 更 加 广泛 (虽然 这 一 概念 并 非 仅 存 在 于 面向 对 象 
。 一 种 说 法 是 ，GUI 的 引入 极 大 地 推动 了 面向 对 象 程序 设计 


苏黎世 联邦 理工 学 院 的 尼克 劳 斯 -维尔 特 和 他 的 同事 们 对 抽象 数据 
和 模块 化 程序 设计 进行 了 研究 。Modula-2 将 这 些 都 包括 了 进去 ， 而 
Oberon 则 包括 了 一 种 特殊 的 面 同 对 象 方法 不 同 于 Smalltalk 与 C++。 


面向 对 象 的 特性 也 被 加 入 了 当时 较为 流行 的 语言 ， 如 Ada、 
BASIC、Lisp、Fortran、Pascal 等 。 由 于 这 些 语言 最 初 并 没有 面 癌 对 象 
的 设计 ， 故 而 这 种 粹 合 常常 会 导致 兼容 性 和 维护 性 的 问题 。 与 之 相反 的 
是 , “纯正 的 ?面向 对 象 语言 却 缺 乏 一 些 程序 员 们 赖 以 生存 的 特性 。 在 这 
一 大 环境 下 ， 开 发 新 的 语言 成 为 了 当务之急 。 作 为 先行 者 ，Eiffel 成 功 
地 解决 了 这 些 问题 ， 并 成 为 了 当时 较 受 欢迎 的 语言 。 


在 过 去 的 几 年 中 ，Java 语 言 成 为 了 三 为 应 用 的 语言 ， 除 了 它 与 C 和 
C++ 语法 上 的 近似 性 。Java 的 可 移植 性 是 它 的 成 功 中 不 可 磨灭 的 一 步 ， 
因为 这 一 特性 已 吸引 了 庞大 的 程序 员 群 的 投入 。 


在 最 近 的 计算 机 语言 发 展 中 ， 一 些 既 文 持 面 问 对 象 程 序 设 计 ， 又 文 
持 面 问 过 程 程序 设计 的 语言 悄然 浮 出 水 面 。 乞 们 中 的 佼佼 者 有 Python、 


Ruby 等 。 
正如 面向 过 程 程序 设计 使 得 结构 化 程序 设计 的 技术 得 以 提升 ， 现 代 


的 面 癌 对 象 程序 设计 方法 使 得 对 设计 模式 的 用 途 、 疤 约 式 设计 和 建 模 语 
言 ( 如 UML) 技术 也 得 到 了 一 定 所 升 。 























阅读 到 此 ， 如 宁 读 者 把 前 面 的 文字 逐 句 读 过 ， 没 有 跳跃 ， 则 姑且 认 
人 
关系 呢 ? 


未 1 林 类 


在 面向 对 象 程式 设计 中 ， 类 〈class) 是 一 种 面向 对 象 计算 机 编程 语 
2 


类 的 更 严格 的 定义 是 由 茶 种 特定 的 元 数据 所 组 成 的 内 聚 的 包 。 它 描 
述 了 一 些 对 象 的 行为 规则 ， 而 这 些 对 象 就 被 称 为 该 类 的 实例 。 类 有 接口 
和 结构 。 接 口 描述 了 如 何 通过 方法 与 类 及 其 实例 互 操作 ， 而 结构 描述 了 
一 个 实例 中 数据 如 何 划 分 为 多 个 属性 。 类 是 与 某 个 层 的 对 象 的 最 具体 的 
类 型 。 类 还 可 以 有 运行 时 表示 形式 (元 对 象 )， 它 为 操作 与 类 相关 的 元 
数据 提供 了 运行 时 文 持 。 


支持 类 的 编程 语言 在 文 持 与 类 相关 的 各 种 特性 方面 都 多 多 少 少 有 一 
些微 妙 的 送 异 。 大 多 数 都 文 持 不 同形 式 的 类 继承 。 许 多 语言 还 文 持 提供 
封装 性 的 特性 ， 比 如 访问 修饰 符 。 类 的 出 现 ， 为 面向 对 象 编程 的 三 个 最 
重要 的 特性 (封装 性 、 继 承 性 、 多 态 性 ) 提供 了 实现 的 手段 。 


看 到 这 里 ， 读 者 或 许 有 一 个 认识 ， 要 OOP 编 程 就 得 用 到 类 。 但 是 ， 
有 反 过 来 束 不 能 说 了 ， 不 是 用 了 类 就 一 定 是 OOP。 























4.1.5 编写 类 


首先 要 明确 ， 类 是 对 某 一 群 具 有 同样 属性 和 方法 的 对 象 的 抽象 。 比 
如 这 个 丛 界 上 和 很多 效 姑 其间 且 会 辟 的 生物 于 是 聪明 的 人 们 就 将 它们 
统一 称 为 “ 鸟 "一 一 这 束 是 一 个 类 ， 虽 然 它 也 可 以 称 作 “ 马 类 ”。 


因为 这 个 例子 不 仅 能 让 读者 阅读 时 不 犯困 ， 还 
能 兴 了 么 闫 类 然 


要 定义 类 ， 就 要 抽象 ， 找 出 共同 的 方面 。 


class 美女 











# 用 











class 来 声明 ， 后 面 定 义 的 是 一 个 类 


pass 


从 这 里 开始 编写 一 个 类 ， 不 过 这 次 暂时 不 用 Python 
码 ， 当 然 ， 这 个 代码 跟 Python 相去 甚 远 。 如 下 : 


class 美女 















































) 
做 饭 


定义 了 一 个 名 称 为 “美女 ”的 类 ， 其 中 约定 ， 没 有 括 


， 而 是 用 伪 代 


号 的 是 属性 ， 带 





人 


对 于 一 个 具体 的 美女 ， 比 如 前 面 提 到 的 王 美 女 ， 她 是 上 面 所 定义 
的 “美女 ”那个 类 的 具体 化 ， 这 在 编程 中 称 为 “美女 类 ”的 实例 。 














= 美女 


() 





用 这 样 一 种 表达 方式 束 是 将 “美女 类 ”实例 化 了 ， 对 “ 王 美 女 ” 这 个 实 
例 ， 就 可 以 具体 化 一 些 属 性 ， 比 如 胸围 ;还 可 以 具体 实施 一 些 方法 ， 比 
如 做 饭 。 通 常 可 以 用 这 样 一 种 方式 表示 : 











a = 王 美女 

















用 点 号 “的 方式 ， 表 示 王 美女 胸围 的 属性 ， 得 到 的 变量 a 就 是 90。 
另外 ， 还 可 以 通过 这 种 方式 给 属性 赋值 ， 比 如 











这 样 ， 这 个 实例 《〈 王 美女 ) 的 皮肤 就 是 黑色 的 了 。 
通过 实例 ， 也 可 以 访问 茶 个 方法 ， 比 如 : 








这 就 是 在 执行 一 个 方法 ， 让 王 美 女 这 个 实例 做 饭 。 现 在 也 比较 好 理 
解 ， 只 有 一 个 具体 的 实例 才能 做 饭 。 


现在 开始 不 用 伪 代 码 了 ， 用 真正 的 Python 代码 来 理解 类 。 当 然 ， 例 
子 还 是 要 用 读者 感 兴趣 的 例子 。 


4.2.1 ”新式 类 和 旧式 类 


因为 Python 是 一 个 不 断 发 展 的 高 级 语言 ， 导 致 了 在 Python 2.x 的 版 本 
中 ， 有 “新 式 类 ”和 “旧式 类 〈 也 叫做 经 典 类 ) ”之 分 。 新 式 类 是 Python 2.2 
引进 的 ， 在 此 后 的 版 本 中 ， 我 们 一 般 用 的 都 是 新 式 类 。 本 着 知 其 然 还 要 
知 其 所 以 然 的 目的 ， 简 单 回 顾 一 下 两 者 的 差别 。 





>>> class AA: 

了 pass 

这 定义 了 一 个 非常 简单 的 类 ， 而 且 是 旧式 类 。 至 于 如 何 定义 类 ， 下 
面 会 详细 说 明 。 读 者 姑且 认同 我 刚才 建立 的 名 为 AA 的 类 ， 为 了 简单 ， 
这 个 类 内 部 什么 也 不 做 ， 就 是 用 pass 一 带 而 过 。 但 不 管 怎样 它 是 一 个 
类 ， 而 且 是 一 个 旧式 类 。 

然后 ， 将 这 个 类 实例 化 : 


>>> aa = AA() 








不 要 坏 记 实例 化 的 时 候 类 的 名 称 后 面 有 一 对 括号 。 接 下 来 做 如 下 操 


>>> type(AA) 
<type 'classobj'> 

>>> aa._ class _ 

<class _ main .AA at 0xb71f017c> 
>>> type(aa) 

<type 'instance'> 


解读 一 下 上 面 的 含义 。 


。type (AA) : 查看 类 AA 的 类 型 ， 返 回 的 是 'classobj'。 

。 aa._class”_: aa 是 一 个 实例 ， 也 是 一 个 对 象 ， 每 个 对 象 都 有 
_ class 属性， 用 于 显示 它 的 类 型 。 这 里 返回 的 结果 是 ， 从 这 个 结 
果 中 可 以 读 出 的 信息 是 ，aa 是 类 AA 的 实例 ， 并 且 类 AA 在 内 存 中 的 
地 址 是 0xb71f017c。 

。type (aa) : 是 要 看 实例 aa 的 类 型 ， 它 显示 的 结果 是 instance， 意 思 
是 告诉 我 们 它 的 类 型 是 一 个 实例 。 


在 这 里 是 不 是 感觉 有 点 不 和 谐 呢 ? aa class 和 type (aa) 都 可 以 
得 看 对 象 类 型 ， 但 是 它们 显示 不 一 样 的 结果 。 比 如 ， 碍 看 这 个 对 象 : 








>>> aa = 7 

>>> a. Class_ 
<type 'int'> 
>>> type(a) 
<type 'int'> 


别 忘 记 了 ， 前 面 提 到 过 的 “万 物 强 对象?”， 那 么 一 个 整数 7 也 是 对 
象 ， 用 两 种 方式 查看 ， 返 回 的 结果 一 样 。 为 什么 到 类 (严格 讲 是 旧式 
类 ) 这 里 ， 居 然 返 回 的 结果 不 一 样 呢 ? 太 不 和 谐 了 。 

于 是 平 ， 就 有 了 新 式 类 ， 从 Python 2.2 开 始 ， 变 成 这 样 了 : 


>>> class BB(object): 


pass 
>>> bb = BB() 
>>> bb._ class _ 
<class ' main .BB'> 
>>> type(bb) 
<class ' main .BB'> 


终于 把 两 者 统一 起 来 了 ， 世 界 和 谐 了 。 
这 就 是 新 式 类 和 旧式 类 的 不 同 。 
当然 ， 不 同 点 绝 非 仅仅 于 此 ， 这 里 只 不 过 提 到 一 个 现在 能 够 理解 的 


不 同 喷 了 。 另 外 的 不 同 还 在 于 两 者 对 于 多 重 继承 的 查找 和 调用 方法 不 
同 ， 旧 式 类 是 深度 优先 ， 新 式 类 是 广度 优先 。 

















不 管 是 新 式 类 还 是 旧式 类 ， 都 可 以 通过 这 样 的 方法 查看 它们 在 内 存 
中 的 存储 空间 信息 。 


>>> print aa 
<_ main .AA instance at 0xb71efd4c> 


>>> print bb 
< main .BB object at Oxb7iefe6c> 


两 个 实例 分 别 告诉 了 我 们 其 是 基于 谁 生成 的 ， 不 过 还 是 稍 有 区 别 。 
知道 了 旧式 类 和 新 式 类 ， 那 么 下 面 的 所 有 内 容 就 都 是 对 新 式 类 而 
这 富 新 大 目 "个 是 编程 经 党 下 的 事情 吗 ? 所 以 旧式 类 就 不 是 我 们 计 

容 了 


还 要 注意 ， 如 果 你 用 的 是 Python 3， 就 不 用 为 新 式 类 和 旧式 类 而 担 
心 了 ， 因 为 在 Python 3 中 压根 儿 就 不 存在 这 个 问题 。 


如 何 定义 新 式 类 呢 ? 
一 种 定义 方法 如 同 前 面 那样 : 














>>> class BB(object): 
pass 





跟 旧 式 类 的 区 别 就 在 于 类 的 名 字 后 面 跟 上 (object) ， 这 其 实 是 一 
种 名 2 本 继 基 "的 多 的 拧 作 ， 当前 的 类 BB 是 以 类 object 为 上 级 的 〈object 被 
称 为 父 类 ) ， 即 BB 是 继承 自 类 object 的 新 类 。 在 Python 3 中 ， 所 有 的 类 
自然 地 都 是 类 object 的 子 类 ， 就 不 用 彰显 出 继承 关系 了 。 


二 种 定义 方法 ， 在 类 的 前 面 写 上 : metaclass ”==type， 然 后 定 
义 类 的 时 候 ， 束 不 需要 在 名 字 后 面 写 (object) 了 。 














>>> __metaclass _ = type 
>>> class CC: 
pass 


>>> cc = CC() 

>>> cc._ class _ 
<class ' main .CC'> 
>>> type(cc) 

<class ' main .CC'> 


两 种 方法 ， 任 你 选用 ， 没 有 优 劣 之 分 。 


4.2.2 :创建 类 








在 一 般 情况 下 ， 一 个 类 不 是 两 三 行 束 能 搞定 的 。 所 以 ， 下 面 可 能 很 
es 因为 那样 一 旦 有 一 点 错误 就 前 功 尽 弃 。 下 面 改 用 编 
戎 界面 。 








#!/Uusr/bin/env python 
# coding=utf-8 


_ metaclass _ = type 
class Person: 
def _ init (self, name): 


self.name = name 


def getName(self): 
return self.name 


def color(self, color): 
print "%s is %s" % (self.name, color) 


上 面 定义 的 是 一 个 比较 常见 的 类 ， 下 面 对 这 个 “大 众 脸 * 的 类 进行 一 
一 解释 。 


(1) 新 式 类 
metaclass ”=type， 意 味 着 下 面 的 类 是 新 式 类 。 
(2) 定义 类 


class Person， 这 是 在 声明 创建 一 个 名 为 “Person” 的 类 。 类 的 名 称 一 
般 用 大 写字 母 开 头 ， 这 是 惯例 。 如 果 名 称 是 两 个 单词 ， 那 么 两 个 单词 的 
首 字 母 都 要 大 写 ， 例 如 class HotPerson， 这 种 命名 方法 有 一 个 形象 的 名 
字 ， 叫 作 “ 允 峰 式 命 名 ”。 当 然 ， 如 果 故 意 不 遵循 此 惯例 ， 也 未 党 不 可 ， 
但 是 ， 会 给 别人 阅读 乃至 于 自己 以 后 阅读 带 来 腑 烦 ， 不 要 起 记 “代码 通 
常 是 给 人 看 的 ， 只 是 侦 尔 让 机 器 执行 ?。 既 然 大 家 都 是 靠 右 走 的 ， 你 就 
别 非 要 在 路 中 间 睡 觉 了 。 


分 别 以 缩 进 表示 的 就 是 这 个 类 的 内 容 了 。 其 实 那 些 东 西 看 起 来 并 不 




















陌生 一 一 就 是 已 经 学 习 过 的 函数 。 不 过 ， 很 多 程序 员 喜 欢 把 类 里 面 的 函 
数 叫 作 “ 方 法 ”， 就 是 上 节 中 说 到 的 对 象 的 “方法 "?。 曾 看 到 有 人 撰文 专门 
分 析 了 “方法 ”和 “函数 ”的 区 别 。 但 是 ， 我 倒是 认为 这 不 重要 ， 重 要 的 是 
类 中 所 谓 "“ 方 法 ?和 前 面 的 国 数 ， 从 数学 角度 看 ， 丝 坚 没 有 区 别 。 所 以 ， 
你 尽 可 以 称 之 为 函数 。 当 然 ， 硝 昕 到 有 人 说 方法 ， 也 不 要 许 寞 和 糊涂 ， 
它们 本 质 是 一 样 的。 


需要 再 次 提醒 ， 函 数 的 命名 方法 是 以 def 发 起 ， 并 且 函 数 名 称 首 字 
0 
尔 的 习惯 了 。 


要 注意 的 是 ， 类 中 的 函数 〈 方 法 ) 的 参数 跟 以 往 的 参数 样式 有 区 
别 ， 那 婚 是 每 个 函数 必须 包括 self 参 数 ， 并 且 作为 默认 的 第 一 个 参数 ， 
这 是 再 要 注意 的 地 方 。 人 至 于 它 的 用 途 ， 继 续 学 习 即 可 知道 。 


(3) 初始 化 


def _init 这 个 函数 一 个 比较 特殊 ， 并 且 有 一 个 名 字 ， 叫 作 初 始 化 
阔 数 (注意 ， 很 多 教材 和 资料 中 把 它 叫 作 构 造 函 数 ， 这 种 说 法 貌似 没有 
错误 ， 但 是 从 字面 意义 上 看 ， 它 对 应 的 含义 是 初始 化 ， 而 且 在 Python 中 
它 的 作用 和 其 他 语言 比 还 不 完全 一 样 ， 因 为 还 有 一 个 _new_ 的 函数 是 
真正 的 构造 。 所 以 ， 我 称 之 为 初始 化 函数 ) 。 它 是 以 两 个 下 画 线 开始 ， 
然后 是 init， 最 后 以 两 个 下 男 线 结束 。 


所 谓 初 始 化 ， 就 是 让 类 有 一 个 基本 的 面 胆 。 做 很 多 事情 都 要 初始 
化 ， 让 事情 有 一 个 具体 的 起 点 状态 。 比 如 你 要 喝 水 ， 必 须 先 初始 化 杯子 
里 面 有 水 。 在 Python 的 类 中 ， 初 始 化 就 担负 着 类 似 的 工作 。 这 个 工作 是 
在 类 被 实例 化 的 时 候 就 执行 这 个 函数 ， 从 而 将 初始 化 的 一 些 属 性 可 以 放 
到 这 个 函数 里 面 。 


此 例子 中 的 初始 化 函数 就 意味 着 实例 化 的 时 候 ， 要 给 参数 name 提 供 
一 个 值 ， 作 为 类 初始 化 的 内 容 。 就 是 在 这 个 类 被 实例 化 的 同时 ， 和 要 通过 
name 参 数 传 一 个 值 ， 这 个 值 被 一 开始 就 写 入 了 类 和 实例 中 ， 成 为 了 类 和 
实例 的 一 个 属性 。 比 如 : 


























girl = Person('canglaoshi') 


girl 古 一 个 实例 对 象 ， 它 有 属性 和 方法 ， 这 里 仅 说 属性 吧 。 当 通过 





上 面 的 方式 实例 化 后 ， 就 目 动 执行 了 初始 化 函数 ， 让 实例 ginl 束 具有 了 


name 属 性 


print girl.name 


执行 这 句 话 的 结果 是 打印 出 canglaoshi。 


这 就 是 初始 化 的 功能 。 简 而 言 之 ， 通 过 初始 化 函数 ， 确 定 了 这 个 实 
例 ( 类 ) 的 “基本 属性 ” 


初始 化 函数 束 是 一 个 阔 数 ， 所 以 ， 它 的 参数 设置 也 符合 前 面 学 过 的 
函数 参数 设置 规范 。 比 如 : 


def _ init (self, *args): 
pass 


这 种 类 型 的 参数 *args 和 前 面 讲述 的 函数 参数 一 样 ，self 这 个 参数 是 
必须 要 有 的 。 


很 多 时 候 ， 并 不 是 每 次 都 要 从 外 面 传 入 数据 ， 有 时 候 会 把 初始 化 函 
0 如 朵 没有 新 的 数据 传 入 ， 束 应 用 这 些 默 认 
。 比 如 : 


class Person: 
def _ init (self, name, lang="golang", website="www.google.com"): 
self.name = name 
self.lang = lang 
self.website = website 
self.email = "qiwsir@gmail.com" 


laogqi = Person("LaoQi") 
info = Person("qiwsir", lang="python", website="qiwsir.github.io") 


print "laogqi.name=", laoqgi.name 


print "info.name=", info.name 

print "------- 机 

print "laogqi.lang=", laoqi.lang 

print "info.1lang=", info.lang 

print "------- . 

print "laoqi.website=", laoqgi.website 

print "info.website=", info.website 
Ee es 
运行 结果 : 


laogqi.name= LaoQi 
info.name= qiwsir 


laodqi.lang= golang 
info.lang= python 
laodqi.website= www.google.com 
info.website= qiwsir.github.io 





在 编程 界 有 这 样 一 句 话 :“ 类 是 实例 工厂 ”， 什 么 意思 呢 ? 生 产物 
品 ， 比 如 生产 电脑 ， 一 个 工 广 可 以 生产 好 多 电脑 ， 那 么 ， 类 就 能 “ 生 
产 ” 好 多 实例 ， 所 以 ， 它 是 “工厂 ”。 比 如 上 面 例子 中 ， 就 有 两 个 实例 。 


4.2.3 ”类 中 的 函数 (方法 ) 


这 里 我 用 “函数 ”这 个 术语 ， 指 的 是 类 中 的 那些 函数 ， 也 把 它 叫 
作 “ 方 法 ”。 但 是 这 里 不 打算 太 深入 区 分 “方法 ”和 “函数 "， 因 为 随 着 读者 
对 编程 的 熟悉 ， 目 然 能 领悟 到 。 上 所 以 ， 我 可 能 在 有 的 地 方 承 接 原 来 的 习 
惯用 “函数 "， 也 可 能 用 “方法 ”。 
再 把 已 经 用 过 的 那个 类 拿 出 来 研究 一 番 。 
#!/Uusr/bin/env python 
# coding=utf-8 
_ metaclass _ = type 
class Person: 
def _ init (self, name): 
self.name = name 


def getName(self): 
return self.name 


def color(self, color): 
print "%s is %s" % (self.name, color) 


构造 函数 的 后 面 有 两 个 函数 : def getName (self) 和 def 
color (self，color) ， 这 两 个 函数 和 前 面 的 初始 化 函数 有 共同 的 地 方 ， 
都 是 以 self 作 为 第 一 个 参数 。 


def getName(self): 
return self.name 


这 个 函数 的 作用 就 是 返回 在 初始 化 时 得 到 的 值 ， 初 始 化 函数 中 


selfname 的 值 能 够 在 这 个 函数 中 被 使 用 ， 其 原因 束 在 于 此 函数 中 不 可 缺 
少 的 参数 self。 


girl = Person('canglaoshi') 
name = girl.getName() 


girl.getName0 就 是 调用 实例 gil 的 getName0 方 法 〈 函 数 ) 。 调 用 该 
方法 的 时 候 要 特别 注意 ， 方 法 名 后 面 的 括号 不 可 少 ， 并 且 括 号 中 不 要 写 
参数 ， 在 类 中 的 getName (self) 函数 第 一 个 参数 self 是 默认 的 ， 当 类 实 
例 化 之 后 ， 调 用 此 函数 的 时 候 ， 第 一 个 参数 不 需要 赋值 。 那 么 ， 变 量 


name 的 最 终结 果 束 是 name="canglaoshi"。 


同样 道理 ， 对 于 方法 : 











def color(self, color): 
print "%s is %s" % (self.name, color) 


也 是 在 实例 化 之 后 调用 : 


girl.color("white") 


这 也 是 在 执行 实例 化 方法 ， 只 是 由 于 类 中 的 该 方法 有 两 个 参数 ， 除 
了 默认 的 self 之 外 ， 还 有 一 个 color， 所 以 ， 在 调用 这 个 方法 的 时 候 ， 要 
为 后 面 那个 参数 传 值 。 


至 此 ， 已 经 将 这 个 典型 的 类 和 调用 方法 分 解 完 毕 ， 把 全 部 代码 完整 
贴 出 ， 请 读者 从 头 到 尾 看 看 ， 是 否 理解 了 每 个 部 分 的 含义 : 
#!/UsSr/bin/env python 
# coding=utf-8 
_ metaclass _ = type 
class Person: 
def _ init (self, name): 


self.name = name 


def getName(self): 
return self.name 


def color(self, color): 
print "%s is %s" % (self.name, color) 


girl = Person('canglaoshi') # 实 例 化 

















name = girl.getName() # 调 用 方法 函数) 





print "the person's name is: ", name 
girl.color("white") # 调 























方法 (函数 ) 


< 





print "------ 
print girl.name # 实 例 的 属性 





保存 后 ， 运 行 得 到 如 下 结果 : 


$ python 20701.py 
the person's name is: canglaoshi 
canglaoshi is white 


canglaoshi 


4.2.4 类 和 实例 


有 必要 总 结 一 下 类 和 实例 的 关系 。 


(1)“ 类 提供 默认 行为 ， 是 实例 的 工厂 ”( 源 自 Learning Python ) ， 
这 句 话 非 常 经 典 ， 一 下 道破 了 类 和 实例 的 关系 。 所 谓 工 厂 ， 怠 是 可 以 用 
同一 个 模子 做 出 很 多 具体 的 产品 。 类 就 是 那个 模子 ， 实 例 就 是 具体 的 产 
品 。 所 以 ， 实 例 是 程序 处 理 的 实际 对 象 。 


(2) 类 由 一 些 语句 组 成 ， 但 是 实例 通过 调用 类 生成 ， 每 次 调用 一 
个 类 ， 就 得 到 这 个 类 的 新 的 实例 。 


(3) 命名 类 必须 用 class， 例 如 class Person。Class 发 起 了 一 个 可 执 
行 的 语句 ， 如 果 执 行 ， 就 得 到 一 个 类 对 象 ， 并 且 将 这 个 类 对 象 赋值 给 对 
象 名 (比如 Person) 。 


也 许 上 述 比较 还 不 足以 让 你 把 类 和 实例 理解 透彻 ， 没 和 关系， 继续 学 
习 ， 在 前 进 中 排除 疑惑 。 














4.2.5 self 的 作用 


类 里 面 的 函数 ， 第 一 个 参数 是 self， 而 且 不 能 省 略 。 但 是 在 实例 化 
的 时 候 ， 这 个 参数 不 需要 写 ， 也 不 需要 为 这 个 参数 传 值 ， 似 乎 没有 这 个 
参数 什么 事 儿 了 ， 真 的 是 这 样 吗 ? self 是 干什么 的 呢 ? 


self 是 一 个 很 神奇 的 参数 。 


还 是 以 前 面 的 类 “Person” 为 例 ， 在 Person 实 例 化 的 过 程 中 
girl=Person ("canglaoshi") ， 字 符 串 "canglaoshi" 通 过 初始 化 函数 
(_init _()) 的 参数 已 经 存 入 到 内 存 中 ， 并 且 以 Person 类 型 的 面貌 存 
在 ， 组 成 了 一 个 对 象 ， 这 个 对 象 和 变量 gil 建立 引用 关系 。 这 个 过 程 也 
可 说 成 这 些 数据 附加 到 一 个 实例 上 。 这 样 就 能 够 以 object.attribute 的 形 
式 ， 在 程序 中 任何 地 方 调 用 某 个 对 象 〈 数 据 ) 。 例 如 上 面 的 程序 中 以 
girl.name 的 方式 得 到 "canglaoshi"。 这 种 调用 方式 ， 在 类 和 实例 中 经 常 使 
用 ， 点 号 “.” 后 面 的 称 之 为 类 或 者 实例 的 属性 。 


这 是 在 程序 中 ， 并 且 是 在 类 的 外 面 。 如 果 在 类 的 里 面 ， 想 在 某 个 地 
方 使 用 实例 化 所 传 入 的 数据 〈"canglaoshi") ， 怎 么 办 ? 


在 类 内 部 ， 束 是 将 所 有 传 入 的 数据 都 赋 给 一 个 变量 ， 通 单 这 个 变量 
的 名 字 古 self。 注 意 ， 这 是 习惯 ， 而 且 是 共识 ， 所 以 ， 你 束 不 要 费 尽心 
机 男 外 取 别 的 名 字 了 。 


在 初始 化 函数 中 的 第 一 个 参数 self 就 是 起 到 了 这 个 作用 一 一 接收 实 
例 化 过 程 中 传 入 的 所 有 数据 ， 这 些 数 据 是 初始 化 函数 的 参数 导入 的 。 显 
然 ，self 应 该 整 是 一 个 实例 (准确 说 法 是 应 用 实例 ) ， 因 为 它 所 对 应 的 
就 是 具体 数据 。 


如 宁 将 上 面 的 类 稍 加 修改 ， 看 看 效果 : 











#!/Uusr/bin/env python 
# coding=utf-8 


_ metaclass _ = type 


class Person: 
def _ init (self, name): 
self.name = name 
print self 
print type(self) 





其 他 部 分 省 略 。 当 初始 化 的 时 候 ， 首 先 要 运行 构造 函数 ， 同 时 打印 
新 增 的 两 条 。 结 果 是 : 


< main_ .Person object at 0xb7282cec> 
<class ' main__ ,Person '> 


证 实 了 推理 ，self 就 是 一 个 实例 《准确 说 是 实例 的 引用 变量 ) 。 


self 这 个 实例 跟前 面 说 的 那个 girl 所 引用 的 实例 对 象 一 样 ， 也 有 属 
性 。 那 么 ， 接 下 来 驶 规定 其 属性 和 属性 对 应 的 数据 。 上 面 代码 中 : 
self.name=name， 束 是 规定 了 self 实 例 的 一 个 属性 ， 这 个 属性 的 名 字 也 叫 
作 name， 上 且 属 性 的 值 等 于 初始 化 函数 的 参数 name 所 导入 的 数据 。 注 
意 ，self. name 中 的 name 和 初 姑 化 函数 的 参数 name 没 有 任何 关系 ， 它们 两 
个 一 样 ， 只 不 过 是 一 种 巧合 (经 常 巧 合 ， 其 实 是 为 了 省 事 和 以 后 识别 方 
便 而 故意 让 它们 巧合 ， 或 者 说 是 写 代 人 码 的 人 懒 懈 ， 不 想 另 外 取 名 字 而 
二， 万 他 六 .5 当 公 ， 如 果 写 成 self xyz=name， 也 是 可 以 的 。 


其 实 ， 从 效果 的 角度 来 理解 更 简化 : 类 的 实例 girl 对 应 着 self，gil 
通过 self 导 入 实例 属性 的 所 有 数据 。 


当然 ，self 的 属性 数据 ， 也 不 一 定 非得 由 参数 传 入 ， 也 可 以 在 构造 
函数 中 目 己 设 定 。 比 如 : 











#1!/UsSr/bin/env python 
#coding:utf-8 


_ metaclass _ = type 
class Person: 


def _ init (self, name): 
self.name = name 


























self.email = "qiwsir@gmail.com" # 这 个 属性 不 是 通过 参数 传 入 的 
info = Person("qiwsir") # 换 个 字符 串 和 实例 化 变量 
print "info.name=", info.name 
print "info.email=", info.email 


运行 结 


info.name= qiwsir 
info.email= qiwsir@gmail .com # 打 印 结果 





这 个 例子 让 我 们 拓展 了 对 self 的 认识 ， 它 不 仅仅 是 为 了 在 类 内 部 传 
递 参数 导入 的 数据 ， 还 能 在 初始 化 函数 中 ， 通 过 self.attribute 的 方式 ， 规 
0 这 个 属性 也 是 类 实例 化 对 象 的 属性 ， 即 作为 类 

过 初始 化 函数 初始 化 后 所 具有 的 属性 。 所 以 在 实例 info 中 ， 通 过 
email 同 样 能 够 得 到 该 属性 的 数据 。 在 这 里 ， 就 可 以 把 self 形 象 地 理 
解 为 “内 外 兼 修 "了 。 或 者 按照 前 面 所 提 到 的 ， 将 info 和 self 对 应 起 来 ， 
self 主 内 ，info 主 外 。 





4.2.6 ”文档 字符 品 
本 书 中 已 经 强调 过 写 注 释 的 重要 性 了 ， 同 样 ， 在 类 里 面 也 要 写 点 东 
西 。 


在 函数 里 面 ， 可 以 用 三 重 引号 来 号 说 明 ， 在 类 中 也 可 以 ， 其 实在 文 
件 开头 的 部 分 也 能 用 三 重 引号 写 文档 字符 串 说 明 。 这 样 写 的 最 大 好 处 是 
能 够 用 helpO 函 数 看 。 





"""This is python lesson""" 


def Start _func(arg): 
"This is a function. 
pass 


Class MyClass.: 
""Thi is my class.""" 
def my_method(self,arg): 
"" ?This is my method.""" 
pass 


这 样 的 文档 是 必需 的 。 当 然 ， 在 编程 中 ， 有 不 少 地 方 要 用 “护符 号 
来 做 注释 。 


4.3 辨析 有 天 概念 





在 掌握 了 类 的 基本 知识 的 基础 上 ， 对 与 类 有 关 的 几 个 概念 进行 深入 
辨析 ， 这 种 辨析 的 目的 在 于 让 读者 对 类 有 更 深入 的 了 解 ， 诚 然 ， 更 需要 
实践 练习 ， 通 过 实践 能 够 深入 感悟 到 内 在 的 奥秘 。 


4.3.1 类 属性 和 实例 属性 


一 个 类 实例 化 后 ， 实 例 是 一 个 对 象 ， 它 有 属性 。 不 要 二 记 ，Python 
中 的 类 也 是 一 个 对 象 ， 且 也 有 属性 。 所 以 就 有 了 “类 属性 ”和 "实例 属 
性 ”两 个 属性 。 


>>> class A(object): 
Re X = 7 


在 交互 模式 下 ， 定 义 一 个 很 简单 的 类 ， 类 中 有 一 个 变量 x=7， 当 
然 ， 如 果 愿 意 还 可 以 写 得 复杂 点 儿 。 








>>> A.x 


在 类 A 中 ， 变 量 x 所 引用 的 对 象 ， 能 够 直接 通过 类 调用 。 或 者 说 x 是 
类 A 的 属性 ， 这 就 是 所 谓 的 “类 属性 ”"。 类 属性 仅 限 于 此 一 一 类 中 的 变量 
还 有 另外 的 称呼 ， 如 静态 数据 。 





>>> foo = A() 
>>> foo.x 
学 


将 类 A 实例 化 ， 通 过 实例 foo 也 可 以 得 到 属性 (foo.x〉， 这 个 属性 叫 
作 “ 实 例 属性 ”。 


对 于 同一 属性 ， 可 以 用 类 来 访问 (类 属性 ) ， 在 一 般 情 况 下 ， 也 可 


以 通过 实例 来 访问 同样 的 属性 。 


但 有 时 候 它们 有 区 别 。 相 同 的 地 方 好 理解 ， 关 键 是 区 别 才 是 编程 中 
要 注意 之 处 。 
>>> foo.x += 1 
>>> foo.x 


>>> A.x 
7 


实例 属性 (foo.x) 更 新 了， 类 属性 (A.x) 没有 改变 。 这 全 少 说 
明 ， 类 属性 不 会 被 实例 属性 左右 ， 也 可 以 进一步 说 明 “ 类 属性 与 实例 属 
性 无 关 ”( 这 人 句 话 不 能 理解 为 “类 属性 * 和 “实例 属性 ” 互 不 相关 ， 如 朵 要 
这 么 理解 ， 按 照 更 严格 的 逻辑 ， 应 该 还 要 看 看 修改 A.x 变 化 是 否 影 响 到 
foo.x) 。 


那么 ，foo.x+=1 的 本 质 是 什么 呢 ? 


其 本 质 是 实例 foo 又 建立 了 一 个 新 的 属性 ， 但 是 这 个 属性 《新 的 
foo.x) 居然 与 原来 的 属性 〈 旧 的 foo.x) 重 名 ， 所 以 ， 原来 的 foo.x 就 
被 “遮盖 了 ”， 只 能 访问 到 新 的 foo.x， 它 的 值 是 8g。 既 然 新 的 foo.x“ 遮 
新 ”了 旧 的 foo.x， 如 果 删 除 它 ， 旧 的 束 会 显现 出 来 。 














>>> foo.x 
8 
>>> del foo.x 


>>> foo.x 
7 


的 确 是 这 样 ， 删 除 新 的 foo.x 之 后 ， 被 它 禾 兰 的 foo.x 值 就 显示 出 来 
了 。 





此 外 ， 还 可 以 通过 建立 一 个 不 与 旧 的 实例 属性 重 名 的 实例 属性 ， 理 
解 上 述 过 程 。 
>>> foo.y = foo.x + 1 
>>> foo.y 


>>> foo.x 
7 








foo.y 就 古 新 建 的 一 个 实例 属性 ， 它 没有 影响 原来 的 实例 属性 foo.x。 


前 面 看 到 了 实例 属性 不 左右 类 属性 ， 反 过 来 ， 类 属性 能 否 影响 实例 
属性 呢 ? 这 点 似乎 应 该 好 解释 ， 因 为 实例 就 是 通过 实例 化 类 实现 的 ， 按 
照 推理 ， 实 例 属性 应 该 受到 类 属性 的 影响 。 











>>> A.x += 1 
>>> A.x 


>>> foo.x 
8 


实例 属性 的 值 随 看 类 属性 的 值 变化 而 改变 了 。 


综 上 , “类 属性 不 受 实例 属性 影响 ， 但 实例 属性 受到 类 属性 左右 ” 
不 过 ， 这 个 结论 是 有 条 件 的 ， 前 面 例子 中 类 内 的 变量 应 用 的 是 不 可 变 对 
象 〈 整 数 ) 。 根 据 对 可 变 对 象 和 不 可 变 对 象 的 研究 经 验 〈 可 以 参考 浅 找 
贝 和 深 堵 贝 )》， 按 照 保 守 主 义 的 原则 “什么 是 保守 主义 ?保守 不 等 于 守 
旧 ， 其 他 的 含义 ， 读 者 可 以 查阅 有 关 书 籍 资料 。) ， 还 应 该 考察 对 象 是 
Me 











>>> class B(object ) : 
了 y = [1，2，3 


这 次 定义 的 类 中 ， 变 量 引 用 的 是 一 个 可 变 对 象 一 列表。 


>>> B.y 

[1, 2, 3] 
>>> bar = B() 
>>> bar.y 

[1, 2, 3] 


>>> bar.y.append(4) 
>>> bar.y 


>>> B.y.append("aa") 
>>> B.y 

[1, 2, 3, 4, "aa '] 

>>> bar.y 

[1, 2, 3, 4, "aa '] 


从 上 面 的 比较 操作 中 ， 你 能 得 出 什么 结论 ? 当 类 中 变量 引用 的 是 可 
变 对 象 时 ， 类 属性 和 实例 属性 都 能 直接 修改 这 个 对 象 ， 从 而 影响 另 一 方 


的 值 。 
以 保守 主义 为 原则 的 思维 方法 胜利 了 。 
继续 看 类 属性 和 实例 属性 的 区 别 。 


>>> foo = A() 
>>> dir(foo) 
'_class ', '_ delattr ', '_dict ', '_doc ', '_ format ', '_ getattribute _ 
9 








0 
< 4] 。 


>>> A.y = "hello" 
>>> foo.y 
"he11o 


ee 


反 过 来 ， 如 果 增 加 实例 属性 ， 会 不 会 也 同时 增加 一 个 类 属性 呢 ? 


>>> foo.z = "python" 
>>> foo.z 
'python' 
>>> A,Z 
Traceback (most recent call last): 
File "<stdin>", line 1, in <module> 
AttributeError: type object 'A' has no attribute ‘'z' 


类 并 没有 收纳 通过 实例 增加 的 这 个 属性 ， 一 步 说 明 ， 类 属性 不 
受 实 例 属 性 左右 。 


不 管 是 通过 类 ， 还 是 通过 实例 ， 都 可 以 增加 和 修改 属性 ， 其 方法 就 
是 通过 类 或 者 实例 的 点 号 操作 来 实现 ， 即 object.attribute， 可 以 实现 对 属 
性 的 修改 和 增加 。 








4.3.2 ”数据 流转 


在 类 的 应 用 中 ， 最 广泛 的 是 将 类 实例 化 ， 通 过 实例 来 执行 各 种 方法 


《 即 类 里 面 的 函数 ) 。 所 以 ， 对 此 过 程 中 的 数据 流转 一 定 要 弄 明白 。 


还 是 回 到 前 面 让 你 兴趣 各 然 的 那个 实例 ， 只 做 适当 修改 ， 请 
出 "canglaoshi"。 这 里 将 注释 删除 ， 读 者 是 否 能 够 写 上 必要 的 注释 呢 ?” 如 
果 你 能 把 注释 写 上 ， 就 说 明 已 经 理解 了 类 的 基本 结构 。 





#!/UsSr/bin/env python 
# coding=utf-8 


_ metaclass _ = type 
class Person: 
def _ init (self, name): 


self.name = name 


de 


+h 


getName( self): 
return self.name 


def breast(self, n): 
self.breast = n 


def color(self, color): 
print "%s is %s" % (self.name, color) 


de 


-+h 


how( self): 
print "%s breast is %s" % (self.name, self.breast) 


girl = Person('canglaoshi') 
girl.breast(90) 


girl.color("white") 
girl.how() 


运行 后 结果 : 


$ python 20701.py 
canglaoshi is white 
canglaoshi breast is 90 


一 图 胜 千 言 ， 有 图 有 真相 。 通 过 图 示 ， 我 们 看 一 看 数据 的 流转 过 
程 ， 如 图 4-1 所 示 。 














CcLass Person: 
def _ init__(self, name): 
self.nanm = name 


def getNanme(self): 
retumn petit.name 


def brga 碑 (seLf，NN- 
sgélf.breast = n 


def 


(ea 


(ob glaoshi') 
girl.breast(90) 


girl.color("white") 
[ob 





图 4-1 数据 的 流转 过 程 








创建 实例 girl=Person 〈'canglaoshi') ， 注 意 观察 图 上 的 箭头 方 癌 。 
gil 这 个 实例 和 Person 关 中 的 Self 对应， 这 正 是 应 了 上 和 节 所 概括 的 “实例 变 
量 与 self 对 信 js 实例 变量 主 外 ， self 主 内 ”的 结论 。"canglaoshi" 是 一 个 具 
体 的 数据 ， 通 过 初始 化 函数 中 的 name 参 数 ， 传 给 self.name， 你 应 已 知 
self 也 是 一 了 | 可 以 为 它 设置 属性 ，self.name 就 是 一 个 属性 ， 经 过 
初始 化 函数 ， 这 个 属性 的 值 由 参数 name 传 入 ， 现 在 就 是 "canglaoshi"。 


在 类 Person 的 其 他 方法 中 ， 都 是 以 self 为 第 一 个 或 者 唯一 一 个 参数 。 
注意 ， 在 Python 中 ， 这 个 参数 要 显明 写 上 ， 在 类 内 部 的 函数 的 参数 中 是 
不 能 省 略 的 。 这 就 表示 所 有 方法 都 继承 self 实 例 对 象 ， 它 的 属性 也 被 市 
到 每 个 函数 之 中 。 例 如 在 其 他 函数 里 面 使 用 self.name 即 是 调用 前 面 已 经 
确定 的 实例 属性 数据 。 当 然 ， 在 函数 中 ， 还 可 以 继续 为 实例 self 增 加 属 
比如 self.breast。 这 样 ， 通 过 self 实 例 ， 就 实现 了 数据 在 类 内 部 的 流 


如 果 要 把 数据 从 类 里 面 传 到 外 面 ， 可 以 通过 return 语 句 实 现 。 如 上 
面 例子 中 所 示 的 getName 方 法 。 


实例 名 称 girl 和 self 是 对 应 关系 ， 实 际 上 ， 在 类 里 面 也 可 以 用 girl 代 
蔡 self。 例 如 ， 做 如 下 修改 : 





#!/UsSr/bin/env python 
# coding=utf-8 


_ metaclass _ = type 


class Person: 
def _ init (self, name): 
self.name = name 


def getName(self): 
#return self.name 
return girl.name # 修 改 成 这 样 ， 但 是 在 编程 实践 中 不 要 这 么 做 。 
































girl Person('canglaoshi') 
name girl.getName() 
print name 


运行 之 后 ， 打 印 : 
canglaoshi 


这 个 例子 说 明 ， 在 实例 化 之 后 ， 实 例 变量 gitl 和 函数 里 面 的 self 实 例 
是 完全 对 应 的 。 但 是 ， 千 万 不 要 用 上 面 修改 的 方式 ， 因 为 那样 写 使 类 没 
有 独立 性 ， 这 是 大 忌 。 


4.3.3 ”命名 空间 


命名 空间 (namespaces) ， 在 研究 类 或 者 面 同 对 象 编程 中 ， 它 常常 
被 提 到 。 虽 然 在 函数 那 部 分 已 经 对 命名 空间 有 初步 解释 ， 但 那 是 在 函数 
的 知识 范畴 中 的 理解 。 现 在 ， 我 们 在 类 的 知识 范畴 中 理解 “类 命名 空 
间 ” 一 一 定义 类 时 ， 所 有 位 于 class 语 句 中 的 代码 都 在 某 个 命名 空间 中 执 
行 ， 即 类 命名 空间 。 


在 研习 命名 空间 以 前 ， 请 打开 Python 的 交互 模式 ， 输 入 import this， 
可 以 看 到 : 








>>> import this 
The Zen of Python, by Tim Peters 


Beautiful is better than ugly. 
Explicit is better than implicit. 
Simple is better than complex. 


Complex is better than complicated. 

Flat is better than nested. 

Sparse is better than dense. 

Readability counts. 

Special cases aren't special enough to break the rules. 

Although practicality beats purity. 

Errors should never pass silently. 

Unless explicitly silenced. 

In the face of ambiguity, refuse the temptation to guess. 

There should be one-- and preferably only one --obvious way to do it. 
Although that way may not be obvious at first unless you're Dutch. 
Now is better than never. 

Although never is often better than *right* now. 

If the implementation is hard to explain, it's a bad idea. 

If the implementation is easy to explain, it may be a good idea. 
Namespaces are one honking great idea -- let's do more of those! 


这 就 是 所 谓 的 《Python 之 禅 》， 请 看 最 后 一 句 “Namespaces are one 
honking great idea--let's do more of those! ”， 一 般 情况 下 ， 最 后 一 句 都 是 
比较 重要 的 。 比 如 有 人 做 讲座 ， 一 大 堆 PPT 一 页 一 页 地 播放 着 ， 口 中 念 
念 有 词 ， 或 放 对 你 部 没有 什么 用 途 ， 但 是 当 他 说 出 “谢谢 聆听 ”这 人 句 话 的 
时 候 ， 你 一 定 会 从 铭 错 沉沉 中 清醒 过 来 ， 因 为 他 说 了 最 后 一 句 ， 标 志 着 
演说 结束 。 所 由 干 万 要 认真 听 最 后 一 句 呀 。 


《Python 之 禅 》 在 最 后 一 句 中 说 到 了 Namespaces， 可 见 命名 空间 的 
重要 性 。 


把 已 经 阐述 过 的 命名 空间 用 一 句 比 较 学 术 化 的 语言 概括 : 命名 空间 
是 从 所 定义 的 命名 到 对 象 的 映射 集合 。 


不 同 的 命名 空间 可 以 同时 存在 ， 彼 此 相互 独立 互 不 干扰 。 
命名 空间 因为 对 象 的 不 同 也 有 所 区 别 ， 可 以 分 为 如 下 几 种 。 


(1) 内 置 命 名 空间 (Built-in Namespaces) : Python 运 行 起 来 ， 它 
们 就 存在 了 。 内 置 函 数 的 命名 空间 都 属于 内 置 命 名 空 zs 间 ， 所 以 ， 我 们 可 
以 在 任何 程序 中 下 接 运 云 行 它们 ， 比 如 前 面 的 id()， 不 需要 做 什么 操作 ， 

拿 过 来 就 能 直接 使 用 。 


(2) 全 局 命名 空间 (Module:Global Namespaces) : 每 个 模块 创建 
它 自己 所 拥有 的 全 局 命名 空间 ， 不 同 模 块 的 全 局 命名 空 s 间 彼此 独立 ， 不 
同 模 块 中 相同 名 称 的 命名 空间 ， 也 会 因为 模块 的 不 同 而 不 相互 干扰 。 


(3) 本 地 命名 空间 (Function&Class:Local Namespaces) : 模块 中 



































有 函数 或 者 类 ， 每 个 函数 或 者 类 所 定义 的 命名 空间 就 是 本 地 命名 空间 。 
如 末 函 数 返回 了 结果 或 者 抛 出 寞 单 ， 则 本 地 命名 空间 也 结束 了 。 


如 图 4-2 所 示 ， 展 示 一 下 上 述 三 种 命名 空间 的 关系 。 
程序 在 查询 上 述 三 种 命名 空间 的 时 候 ， 按 照 从 里 到 外 的 顺序 ， 即 : 


Local Namespaces — Global Namesspaces — Built-in Namesspaces。 





>>> def foo(num, str): 
name = "qiwsir" 
print locals() 


>>> foo(221, "qiwsir.github.io") 
{'nNnum': 221, 'name': 'gqiwsir', 'str': 'giwsir.github.io'} 
>>> 


内 置 命名 空间 


全 局 命名 空间 


本 地 命名 空间 





图 4-2 三 种 命名 空间 的 关系 





这 是 一 个 访问 本 地 命名 空间 的 方法 ， 用 print locals() 完 成 ， 从 这 个 结 
和 


根据 习惯 ， 如 果 访 问 全 局 命名 空间 ， 可 以 使 用 print globals()。 


4.3.4 作用 域 











作用 域 是 指 Python 程序 可 以 直接 访问 到 的 命名 空间 。“ 和 直接 访问 ?在 
这 里 意味 着 访问 命名 空间 中 的 命名 时 无 顷 加 入 附加 的 修饰 符 。 


人 
用 域 。 











def outer_foo(): 
b = 20 
def inner_foo(): 
c= 30 
a= 10 








假如 我 现在 位 于 inner_foo0) 函 数 内 ， 那 么 c 对 我 来 讲 束 在 本 地 作用 
域 ， 而 b 和 a 就 不 是 。 如 果 我 在 inner_foo0 内 再 做 : b=50， 这 其 实 是 在 本 
人 
和 例子: 








#!/UsSr/bin/env python 
#coding:utf-8 


def outer_foo(): 
a= 10 
def inner_ foo() : 
0 


print "inner_foo, a=", a #a=20 


inner_foo() 


print "outer_foo, a=", a #a=10 
a= 30 
outer_foo() 
print "a=", a #a=30 
se 十 
运行 结果 : 


inner_foo, a= 20 
outer_foo, a= 10 
a= 30 





如 末 要 将 东 个 变量 在 任何 地 方 都 使 用 ， 且 能 够 关联 ， 那 么 在 函数 内 
就 使 用 global 声 明 ， 其 实 就 是 曾经 讲 过 的 全 局 变量 。 


4.4 继承 


继承 是 非常 重要 的 ， 因 为 继承 让 我 们 能 够 延续 以 前 的 东西 ， 比 
如 “ 龙 生 龙 、 凤 生 凤 、 老 鼠 的 儿子 会 打 洞 ?是 基因 继承 络 果 ， 除 了 生物 方 
面 的 继承 ， 在 现实 生活 中 , “继承 ”意味 痢 一 个 人 从 另外 一 个 人 那里 得 到 
了 一 些 什么 ， 比 如 继承 革命 先烈 的 光 且 传统 等 。 忆 之 ,“ 继 承 ” 之 后 ， 目 
己 束 在 所 继承 的 方面 省 力气 ， 不 用 劳 神 费 心 束 能 轻松 得 到 。 


但 是 ， 高 级 编程 语言 中 的 “继承 ”?”， 跟 通常 理解 的 继承 会 有 所 不 
同 。“ 继 承 * 在 高 级 编程 语言 中 是 一 个 非常 重要 的 概念 。 虽 然 不 用 继承 一 
样 能 够 编写 程序 ， 但 是 ， 当 我 们 追求 程序 的 更 高 阶层 时 ， 继 承 的 作用 就 
显现 出 来 了 。 

继承 〈Inheritance) 是 面 问 对 象 软件 技术 当中 的 一 个 概念 。 如 果 一 
个 类 别 A“ 继 承 ” 自 男 一 个 类 别 B， 束 把 这 个 A 称 为 “B 的 子 类 别 ”， 而 把 B 
称 为 “A 的 父 类 别 ”， 也 可 以 称 “B 是 A 的 超 类 ”。 

继承 可 以 使 得 子 类 别 具 有 父 类 别 的 各 种 属性 和 方法 ， 而 不 需要 再 次 
编写 相同 的 代码 。 在 令 子 类 别 继承 父 类 别 的 同时 ， 可 以 重新 定义 某 些 局 
性 ， 并 重 写 某 些 方 法 ， 即 履 盖 父 类 别 的 原 有 属性 和 方法 ， 使 其 获得 与 父 
类 别 不 同 的 功能 。 男 外 ， 为 子 类 别 妃 加 新 的 属性 和 方法 也 是 常见 的 做 
法 。“ 源 目 维基 百科 ) 


由 上 面 对 继 承 的 表述 ， 简 单 总 结 出 继承 的 意图 或 者 好 处 : 


(1) 可 以 实现 代码 重用 ， 但 不 是 仅仅 实现 代码 重用 ， 有 时 候 根本 
就 没有 重用 。 


(2) 实现 属性 和 方法 继承 。 


诚然 ， 以 上 也 不 是 全 部 ， 随 着 后 续 学 习 ， 对 继承 的 认识 会 更 深刻 。 
好 友 “ 令 狐 虫 ”曾经 这 样 总 结 继承 : 


从 技术 上 说 ，OOP 里 继承 最 主要 的 用 途 是 实现 多 态 。 对 于 多 态 而 


























言 ， 重 要 的 是 接口 继承 性 ， 属 性 和 行为 是 否 存 在 继承 性 ， 这 是 不 一 定 
的 。 事 实 上 ， 大 量 工程 实践 表明 ， 重 度 的 行为 继承 会 导致 系统 过 度 复杂 
和 腕 有 种， 反而 会 降低 灵活 性 。 因 此 现在 比较 提倡 的 是 基于 接口 的 轻 度 继 
承 理念 。 这 种 模型 里 因为 父 类 接口 类 ) 完全 没有 代码 ， 因 此 根本 谈 不 
上 什么 代码 复 用 。 


在 Python 里 ， 因 为 存在 Duck Type， 接 口 定 义 的 重要 性 大 大 降低 ， 
继承 的 作用 也 进一步 被 削弱 了 。 


人 
顺 关 系 。 


或 许 读者 感觉 比较 高 深 ， 没 关系 ， 随 着 你 对 实践 经 验 的 积累 ， 也 能 
对 这 个 问题 有 自己 独到 的 见解 。 
或 许 你 也 要 问 我 的 观点 是 什么 ， 我 的 观点 就 是 : 走 着 瞧 ! 怎么 理 


解 ? 继续 同 下 看 ， 只 有 你 先 深入 这 个 问题 ， 才 能 跳 到 更 高 层 看 这 个 问 
题 。 小 马 过 河 的 故事 还 记得 吧 ? 只 有 亲自 走 入 河水 中 ， 才 知道 河水 的 深 

















对 于 Python 中 的 继承 ， 前 面 一 直 在 使 用 ， 那 就 是 我 们 写 的 类 都 是 新 
法 : 


class NewStyle(object): 
pass 


这 束 是 典型 的 继承 。 
4.4.1 基本 概念 


在 编辑 器 中 把 这 些 代 码 敲 出 来 。 
#!/UsSr/bin/env python 
# coding=utf-8 
_ metaclass _ = type 


class Person: 


def speak(self): 
print "I love you." 


def setHeight(self): 
print "The height is: 1.60m." 


def breast(self, n): 
print "My breast is: ",n 


class Girl(Person): 
def setHeight(self): 
print "The height is:1.70m ." 


if name == ”main _" 
cang = Girl() 
cang.setHeight() 





cang.speak() 
cang.breast(90) 


上 面 这 个 程序 ， 保 存 之 后 运行 : 


$ python 20901.py 
The height is:1.70m . 
I love you. 

My breast is: 90 


对 以 上 程序 进行 解释 ， 从 中 体会 继承 的 概念 和 方法 。 


首先 定义 了 一 个 类 Person， 在 这 个 类 中 定义 了 三 个 方法 。 注 意 ， 没 
有 定义 初始 化 函数 ， 初 始 化 函数 在 类 中 不 是 必须 的 。 


然后 又 定义 了 一 个 类 gil， 这 个 类 的 名 字 后 面 的 括号 中 是 上 一 
的 名 字 ， 这 就 意味 着 girl 继 承 了 Person，gitrl 是 Person 的 子 类 ，Person 是 
girl 的 父 类 


既然 是 继承 了 Person， 那 么 gil 就 拥有 了 Person 中 的 全 部 方法 和 属性 
(上 面 的 例子 没有 列 出 属性 ) 。 但 是 ， 如 果 ginl 里 面 有 一 个 和 Person 同 样 
名 称 的 方法 ， 那 么 耽 把 Person 中 的 同一 个 方法 遮盖 住 了 ， 显 示 的 是 girl 中 
的 方法 ， 这 叫 作 方 法 的 重 写 。 


实例 化 类 gil 之 后 ， 执 行 实例 方法 cang.setHeightO0， 由 于 在 类 gil 中 
重 写 了 setHeight 方 法 ， 那 么 Person 中 的 那个 方法 就 不 显 作 用 了 ， 在 这 个 
实例 方法 中 执行 的 是 类 gil 中 的 setHeight 方 法 。 


虽然 在 类 girl 中 没有 看 到 Speak 方 法 ， 但 是 因为 它 继 承 了 Person， 上 所 
以 cang.speak0) 束 执行 类 Person 中 的 方法 。 同 理 cang.breast (90) ， 它 们 














就 好 像 是 在 类 girl 里 面 已 经 写 了 这 两 个 方法 一 样 。 


4.4.2 多重 继承 


、 所 谓 多 重 继 承 就 是 指 某 一 个 类 所 继承 的 父 类 ， 不 止 一 个 ， 而 是 多 
广 。 比 如 : 





#!/UsSr/bin/env python 
# coding=utf-8 


_ metaclass _ = type 


class Person: 
def eye(self): 
print "two eyes" 


def breast(self, n): 
print "The breast is: ",n 


class Girl: 
age = 28 
def color(self): 
print "The girl is white" 


class HotGirl(Person, Girl): 





pass 

if name == "_ main _ _": 
kong = HotGirl() 
kong.eye() 


kong.breast(90) 
kong.color() 
print kong.age 





在 这 个 程序 中 ， 前 面 有 两 个 类 : Person 和 girl， 然 后 第 三 个 类 
HotGinl 继 承 了 这 两 个 类 ， 注意 观察 继承 方法 ， 就 是 在 类 的 名 字 后 面 的 括 
号 中 把 所 继承 的 两 个 类 的 名 字 写 上 。 但 是 第 三 个 类 中 什么 方法 也 没有 。 


然后 实例 化 类 HotGirl， 既 然 继 承 了 上 面 的 两 个 类 ， 那 么 那 两 个 类 的 
方法 就 都 能 够 拿 过 来 使 用 。 保 存 程序 ， 运 行 一 下 看 看 : 














$ python 20902.py 

two eyes 

The breast is: 90 
The girl is white 

28 





值得 注意 的 是 ， 在 类 gil 中 ， 有 一 个 age=28， 在 对 HotGil 实 例 化 之 
后 ， 因 为 继承 的 原因 ， 这 个 类 属性 也 被 继承 到 HotGinl 中 ， 因 此 通过 实例 
属性 kong.age 一 样 能 够 得 到 该 数据 。 


所 谓 继承 ， 听 起 来 委 竹 ， 实 际 上 没有 那么 复杂 ， 核 心 特征 是 将 父 类 
的 方法 和 属性 全 部 承接 到 子 类 中 ; 如 果子 类 重 写 了 父 类 的 方法 ， 束 使 用 
子 类 的 该 方法 ， 父 类 的 方法 被 遮盖 。 


4.4.3 ”多重 继承 的 顺序 


学 习 多 重 继承 的 顺序 很 有 必要 。 比 如 ， 如 果 一 个 类 继承 了 两 个 父 
类 ， 并 且 两 个 父 类 有 同样 的 方法 或 者 属性 ， 那 么 在 实例 化 子 类 后 ， 调 用 
哪个 父 类 的 方法 和 属性 呢 ? 编造 一 个 没有 实际 意义 ， 纯 粹 为 了 回答 这 个 
问题 的 程序 ， 体 会 一 下 多 重 继承 的 顺序 。 


#!/UsSr/bin/env python 
# coding=utf-8 


class K1(object ) : 
def fool(self): 
print "Ki-foo" 


class K2(object): 
def fool(self): 
print "K2-foo" 
def bar(self): 
print "K2-bar" 


class J1(K1, K2): 
pass 


class J2(K1, K2): 
def bar(self): 
print "J2-bar" 


class C(J1, J2): 
pass 


if name == ”main __" 
print C.__mro 
m= C() 
m.foo() 
m.bar() 





这 上 段 代码 ， 保 存 后 运行 : 


$ python 20904.py 

(<class '_ main .CcC'>, <class "main .J1'>, <class '_ main .J2'>, <class ' 
K1-foo 
J2-bar 


代码 中 的 print C. mro 是 要 打印 出 类 的 继承 顺序 。 如 果 要 执行 
foo() 方 法 ， 首 先 看 J1， 没 有 ， 看 J]2， 还 没有 ， 看 J1 里 面 的 Kl1， 有 了 就 执 
行 ， 即 C==>J1==>J2==>K1; bar0 也 是 按照 这 个 顺序 ， 在 卫 中 就 找到 了 
= 


这 种 对 继承 属性 和 方法 搜索 的 顺序 称 之 为 “广度 优先 ”。 


在 新 式 类 中 ， 以 及 python3.x 的 类 中 ， 都 是 按照 “广度 优先 ?原则 搜寻 
属性 和 方法 的 。 


但 是 ， 在 旧式 类 中 是 按照 < 深度 优先 * 的 顺序 的 。 因 为 旧式 类 很 少 被 
用 弄 ， 所 以 不 举例 。 交 者 可 以 自己 模仿 上 面 代码 ， 探 索 昌 式 类 的 “深度 








4.4.4 Super 函数 
初始 化 函数 的 继承 跟 一 般 方 法 的 继承 还 有 点 不 同 ， 可 以 看 下 面 的 例 
二 


#!/Uusr/bin/env python 
# coding=utf-8 


_ metaclass _ = type 


class Person: 
def _ init (self): 
self.height = 160 


def about(self, name): 
print "{} is about {}".format(name, self.height) 


class Girl(Person): 
def _ init (self): 
self.breast = 90 


def about(self, name): 
print "{} is a hot girl, she is about {}, and her breast is {}".format(name 


if name == "main " 
cang = Girl() 





cang.about("canglaoshi") 


在 上 面 这 段 程序 中 ， 类 gil 继承 了 类 Person。 在 类 gil 中 ， 初 始 化 设 
置 了 self.breast=90， 由 于 继承 了 Person， 按 照 前 面 的 经 验 ，Person 的 初始 
化 函数 中 的 self.height=160 也 应 该 被 Gil 所 继承 过 来 。 然 后 在 重 写 的 about 
方法 中 调用 self.height。 


实例 化 类 gil， 并 执行 cang.about ("canglaoshi") ， 试 图 打印 出 一 句 
话 canglaoshi is a hot girl, she is about 160，and her bereast is 90 。 








保存 程序 ， 运 行 之 ， 看 看 结果 是 否 如 所 愿 。 


$ python 20903.py 
Traceback (most recent call last): 
File "20903.py", line 22, in <module> 
cang.about("canglaoshi") 
File "20903.py", line 18, in about 
print "{} is a hot girl, she is about {}, and her breast is {}".format(name, se 
AttributeError: 'Girl' object has no attribute 'height' 


报错 ! 
程序 员 有 一 句 名 言 : 不 求 最 好 ， 但 求 报错 。 


报错 不 是 坏事 ， 而 是 我 们 长 经 验 的 时 候 ， 是 在 告诉 我 们 ， 那 么 做 不 
对 。 


重要 的 是 看 报错 信息 ， 就 是 我 们 要 打印 的 那 句 话 出 问题 了 ， 报 错 信 
已 显 示 self.height 是 不 存在 的 ， 也 就 是 说 类 girl 没 有 从 Person 中 继承 过 来 
这 个 属性 。 


原因 是 什么 ? 仔细 观察 类 gil 会 发 现 ， 除 了 刚才 强调 的 about 方 法 重 
写 了 ，_init 方法 也 被 重 写 了 。 不 要 觉得 它 的 名 字模 样 奇 怪 ， 束 不 把 
它 看 作 类 中 的 方法 (函数 ) ， 它 跟 类 Person 中 的 _init 重 名 了 ， 同 样 是 
重 写 了 那个 初始 化 函数 ， 而 gl 中 的 _init_ 中 根本 就 没有 关于 self.height 
的 任何 信息 。 

这 就 提出 了 一 个 问题 ， 因 为 在 子 类 中 重 写 了 某 个 方法 之 后 ， 父 类 中 
同样 的 方法 被 遮盖 了 ， 那 么 如 何 再 把 父 类 的 该 方法 调 出 来 使 用 呢 ? 纵然 
被 庶 新 了 ， 应 该 还 是 存在 的 ， 不 要 浪 绩 了 呀 。 























Python 中 有 这 样 一 种 被 提倡 的 方法 : super 函 数 。 


#!/UsSr/bin/env python 
# coding=utf-8 


_ metaclass _ = type 


class Person: 
def _ init (self): 
self.height = 160 


def about(self, name): 
print "{} is about {}".format(name, self.height) 


class Girl(Person): 
def _ init (self): 
super(Girl, self)._ init _() 
self.breast = 90 


def about(self, name): 
print "{} is a hot girl, she is about {}, and her breast is {}".format(name 
super (Girl, self).about(name) 


if name == ”main ": 
cang = Girl() 
cang.about("canglaoshi") 





在 子 类 中 ，_ init 方法 重 写 了 ， 为 了 调用 父 类 同方 法 ， 使 用 
super (Girl，self) .init 0 的 方式 。super 函 数 的 参数 ， 第 一 个 是 当前 
子 类 的 类 名 字 ， 第 二 个 是 self， 然 后 是 点 号， 点 号 后 面 是 所 要 调用 的 父 
S00 同样 在 子 类 重 写 的 about 方 法 中 ， 也 可 以 调用 父 类 的 about 方 
os 











执行 结 


$ python 20903.py 
canglaoshi is a hot girl, she is about 160, and her breast is 90 
canglaoshi is about 160 


最 后 要 注意 : super 函 数 仅仅 适用 于 新 式 类 。 当 然 ， 你 使 用 的 一 定 古 
新 式 类 ， 因 为 “喜新厌旧 ”是 程序 员 的 嗜好 。 


如 果 你 用 的 是 Python3.x， 则 使 用 super 函 数 的 形 却 稍微 不 同 。 怎 么 
个 不 同 呢 ? 请 你 认真 阅读 下 面 的 “拓展 阅读 ”中 的 资料 〈 不 要 责备 我 不 
说 ， 我 是 在 告诉 你 一 种 非常 好 的 学 习 方法 一 一 看 别人 提出 的 问题 和 解 
答 ， 因 为 那些 问题 也 是 你 的 问题 ) 。 





4.5 方法 





在 前 面 讨 论 类 的 时 候 , “方法 ”这 个 词语 间或 出 现 ， 并 且 还 说 了 不 用 
区 分 “方法 ”和 “函数 ”"， 只 要 知道 所 指 是 什么 就 可 以 了 。 不 过 ， 从 本 节 开 
人 ， 我 们 要 对 糊涂 的 地 方 稍 微 澄清 一 下 ， 并 且 对 “方法 ”做 个 深入 的 探 


九 。 





在 程序 中 最 常见 的 是 实例 化 类 ， 通 过 实例 来 调用 类 的 方法 ， 对 以 往 
的 经 验 稍 加 概括 : 


(1) 方法 是 类 内 部 定义 函数 ， 只 不 过 这 个 函数 的 第 一 个 参数 是 
self〈 可 以 认为 方法 是 类 属性 ， 但 不 是 实例 属性 ) 。 

(2) 必须 将 类 实例 化 之 后 ， 才 能 通过 实例 调用 该 类 的 方法 。 调 用 
的 时 候 在 方法 后 面 要 有 括号 〈 括 号 中 默认 有 self 参 数 ， 但 是 不 写 出 
站 


通过 实例 调用 方法 ， 我 们 称 这 个 方法 绑 定 在 实例 上 。 





45.1 绑 定 方法 


调用 绑 定 方法 ， 其 实 一 直 在 这 样 做 ， 司 空 见 惯 。 比 如 : 


class Person(object ) : 
def fool(self): 
pass 


如 果 要 调用 Person.foo() 方 法 ， 必 须 : 


pp = Person() # 实 例 化 


pp.foo() 





这 样 就 实现 了 方法 和 实例 的 绑 定 ， 于 是 通过 pp.foo0 即 可 调用 该 方 


45.2 非 缉 是 方 读 


还 记得 super 函 数 吗 ? 为 了 描述 方便 ， 把 代码 复制 过 来 : 


#!/UusSr/bin/env python 
# coding=utf-8 


_ metaclass _ = type 


class Person: 
def _ init (self): 
self.height = 160 


def about(self, name): 
print "{} is about {}".format(name, self.height) 


class Girl(Person): 
def _ init (self): 
super(Girl, self)._ init _() 
self.breast = 90 


def about(self, name): 
print "{} is a hot girl, she is about {}, and her breast is {}".format(name 
super (Girl, self).about(name) 


if name == "”_ main 
cang = Girl() 
cang.about("canglaoshi") 





在 子 类 gil 中 ， 因 为 重 写 了 父 类 的 _init 方法， 如果 要 调用 父 类 该 
方法 ， 不 得 不 使 用 super (Girl，self) .，_init_ 0 调用 父 类 中 因为 子 类 方 
法 重 写 而 被 遮蔽 的 同名 方法 。 


在 子 类 中 ， 父 类 的 方法 就 是 非 绑 定 方法 ， 因 为 在 子 类 中 ， 没 有 建立 
父 类 的 实例 ， 却 要 用 父 类 的 方法 。 对 于 这 种 非 绑 定 方法 的 调用 ， 还 有 一 
种 方式 ， 但 现在 已 经 较 少 使 用 了 ， 因 为 有 了 super 函 数 ， 为 了 方便 读者 看 
其 他 有 关 人 代码， 还 是 要 简要 说 明 一 下 。 


例如 在 上 面 的 代码 中 ， 在 类 girl 中 想 调 用 父 类 Person 的 初始 化 函数 ， 
则 需要 在 子 类 中 写 上 这 么 一 行 : 

















Person._ init__(self) 





这 不 是 通过 实例 调用 的 ， 而 是 通过 类 Person 实 现 了 对 
_ init 《self) 的 调用 。 这 就 是 调用 非 绑 定 方法 的 用 途 。 但 是 ， 这 种 方 
法 已 经 被 super 函 数 取 代 ， 所 以 ， 如 果 读 者 在 编程 中 遇 到 类 似 情 况 ， 推 荐 
使 用 super 函 数 。 


4.5.3 ”静态 方法 和 类 方法 


类 的 方法 第 一 个 参数 必须 是 self， 并 且 如 果 要 调用 类 的 方法 ， 要 通 
过 类 的 实例 ， 即 方法 绑 定 实例 后 才能 由 实例 调用 。 如 果 不 绑 定 ， 一 般 在 
继承 关系 的 类 之 间 ， 可 以 用 super 函 数 等 方法 调用 。 


静态 方法 和 类 方法 是 什么 意思 呢 ? 跟 前面 所 说 的 调用 类 方法 有 什么 
关系 吗 ? 先 看 代码 : 








#!/Uusr/bin/env python 
# coding=utf-8 


_ metaclass _ = type 


class StaticMethod: 
@staticmethod 
def foo(): 
print "This is static method foo()." 


class ClassMethod: 
@classmethod 
def bar(cls): 
print "This is class method bar()." 
print "bar() is part of class:", cls._ name _ 



































if name == "_ main _": 
static_foo = StaticMethod() # 实 例 化 
static_foo.foo() # 实 例 调用 静态 方法 
StaticMethod.foo() # 通 过 类 来 调用 静态 方法 








print 咱 淡 火炎 火炎 火炎 类 
class_bar = ClassMethod() 
class_bar.bar() 
ClassMethod.bar() 


对 于 这 部 分 代码 ， 有 一 处 非常 特别 ， 那 残 是 包含 了 “@” 符 写 〈 带 @ 
符号 的 东西 是 很 神奇 的 ) 。 在 Python 中 : 


(1) @staticmethod 表 示 下 面 的 方法 是 静态 方法 。 
(2) @classmethod 表 示 下 面 的 方法 是 类 方法 。 
是 不 是 感到 有 点 莫名其妙 ? 少 安 毋 踩 ， 一 个 一 个 解释 。 


先 看 静态 方法 ， 虽 然 名 为 静态 方法 ， 但 也 是 方法 ， 所 以 ， 依 然 用 
def 语 句 来 定义 。 需 要 注意 的 是 文件 名 后 面 的 括号 内 没有 self， 这 和 前 面 
定义 的 类 中 的 方法 不 同 ， 也 正 是 因为 这 个 不 同 ， 才 给 它 男 外 取 了 一 个 名 
字 叫 作 静 态 方法 ， 人 否则 不 束 * 汇 然 众 人 癸 ?。 如 宁 没 有 self， 那 么 也 就 无 
， 问 实例 变 量 、 类 和 实例 的 属性 了 ， 因 为 它们 都 是 借助 self 来 传递 数 


再 看 类 方法 ， 同 样 也 具有 一 般 方 法 的 特点 ， 区 别 也 在 参数 上 。 类 方 
法 的 参数 也 没有 self， 但 是 必须 有 cls 这 个 参数 。 在 类 方法 中 ， 能 够 访问 
类 属性 ， 但 是 不 能 访问 实例 属性 〈 读 者 可 以 自行 设计 代码 检验 之 ) 。 

明确 两 种 方法 之 后 ， 继 续 探 究 如 何 调 用 。 两 种 方法 都 可 以 通过 实例 
调用 ， 即 绑 定 实例 。 也 可 以 通过 类 来 调用 ， 即 StaticMethod.foo0 这 样 的 
形式 ， 这 也 是 区 别 一 般 方法 的 地 方 ， 一 般 方法 必须 通过 绑 定 实例 调用 。 


上 述 代码 运行 结果 : 











$ python 21001.py 

This is static method foo(). 

This is static method foo(). 

类 火炎 火炎 火炎 尖 

This is class method bar(). 

bar() is part of class: ClassMethod 
This is class method bar(). 

bar() is part of class: ClassMethod 





这 是 关于 静态 方法 和 类 方法 的 简要 介绍 。 


正当 我 思考 如 何 讲解 地 更 深入 一 点 的 时 候 ， 想 起 了 以 往 看 过 的 一 篇 
文章， 觉得 人 家 讲 得 非常 到 位 。 文 章 标题 是 : 《python 中 的 staticmethod 
和 classmethod 的 差异 》， 原 载 于 : www.pythoncentral.io/difference- 
between-staticmethod-and-classmethod-in-python/。 此 地 址 需要 你 准备 梯 





子 才 能 浏览 。 后 经 国人 翻译 ， 地 址 是 : 
http:/www.wklken.me/posts/2013/12/22/difference-between-staticmethod- 
and-classmethod-in-python.html。 


4.6 多 态 NINN 和 和 封装 


“继承 ”是 类 的 一 个 重要 特征 ， 在 编程 中 用 途 很 多 ， 虽 然 在 某 些 具 
体 、 细 节 的 层面 还 有 一 些 不 同 的 看 法 但是， 这 里 要 说 的 “多 态 ”* 和 “ 封 
装 ” 无 论 是 在 理解 上 还 是 在 实践 上 都 是 有 争议 的 话题 。 所 谓 和 争议 ， 多 来 
目 于 对 同一 个 现象 不 同 角度 的 理解 ， 特 别 是 有 不 少 经 验 丰 富 的 程序 员 ， 
还 从 其 他 语言 的 角度 来 诠释 Python 的 多 态 等 。 不 管 有 多 少 不 同 的 理解 方 
我 们 都 要 对 这 两 个 东西 有 所 了 解 ， 因 为 它们 是 你 编程 水 平 进 阶 的 必 


4.6.1 多 态 


到 网 上 搜索 “多 态 ”， 仁 者 见 仁 智 者 见 智 。Python 中 关于 多 态 的 基本 
体现 ， 可 以 通过 下 面 的 方式 来 理解 。 





>>> "This is a book".count("s") 
2 

>>> [1,2,4,3,5,3].count(3) 

2 





count() 辫 数 的 作用 是 数 一 数 全 个 元 系 在 对 象 中 出 现 的 次 数 。 从 例子 
中 可 以 看 出 ， 我 们 并 没有 限定 count 的 参数 所 引入 的 值 应 该 是 什么 类 型 
的 。 类 似 的 例子 还 有 : 


>>> f = lambda x, y: x+y 


还 记得 这 个 lambda 函 数 吗 ? 


>>> f(2，3) 
5 


>>> f("qiw", "sir") 

'qiwsir' 

>>> f(["python", "java"], ["c++", "lisp"]) 
['python', 'java', 'c++', 'lisp'] 


在 这 个 lambda 函 数 中 ， 我 们 没有 限制 应 该 传 入 什么 类 型 的 对 象 ( 或 
者 说 数据 、 值 》， 也 一 定 不 能 限制 ， 因 为 如 果 限制 了 了 7， 就 不 是 pythonic 
了 。 也 就 是 说 ， 允 许 给 参数 传 任意 类 型 的 数据 ， 并 返回 相应 的 结果 ， 至 
于 是 否 报 错 ， 则 取决 于 “+” 的 能 力 范 围 。 这 就 是 “多 态 ” 的 表现 。 


“多 态 ” 是 否 能 正确 表达 ， 不 是 通过 限制 传 入 的 对 象 类 型 实现 ， 而 是 
这 样 处 理 : 











>>> f("qiw"，2) 
Traceback (most recent call last): 
File "<stdin>", line 1, in <module> 
File "<stdin>", line 1, in <lambda> 
TypeError: cannot concatenate 'str' and 'int' objects 


这 个 例子 中 ， 把 判断 两 个 对 象 是 否 能 够 相 加 的 任务 交 给 了 “+”， 不 
是 放 在 入 口 处 判断 类 型 是 否 为 字符 串 或 者 数字 。 


申明 ， 本 书 由 于 无 意 对 概念 进行 讨论 ， 所 以 不 进行 这 方面 的 深入 探 
索 ， 仅 仅 是 告诉 各 位 读者 相关 信息 。 并 且 ， 既 然 大 多 数 程序 员 都 在 讨论 
多 态 ， 那 么 我 们 就 按照 大 多 数 人 说 的 去 介绍 。 


“多 态 ”(Polymorphism) ， 维 基 百 科 中 对 此 有 详细 解释 说 明 。 


多 型 (英语 : Polymorphism) ， 是 指 面 向 对 象 程序 执行 时 ， 相 同 的 
信息 可 能 会 送 给 多 个 不 同 的 类 别 对 象 ， 系 统 可 依据 对 象 所 属 类 别 ， 引 发 
对 应 类 别 的 方法 而 有 不 同 的 行为 。 简 单 来 说 ， 所 谓 多 型 意 指 相同 的 信息 
给 予 不 同 的 对 象 会 引发 不 同 的 动作 。 


简化 的 说 法 就 是 < 有 多 种 形式 ”， 就 算 不 知道 变量 《参数 ) 所 引用 的 
对 象 类 型 ， 也 一 样 能 进行 操作 ， 来 者 不 拒 ， 比 如 上 面 显示 的 例子 。 在 
Python 中 ， 更 为 pythonic 的 做 法 是 根本 就 不 进行 类 型 检验 。 


例如 著名 的 repr0) 函 数 ， 它 能 够 针对 输入 的 任何 对 象 返 回 一 个 字符 
串 ， 这 了 就 是 多 态 的 代表 之 一 。 

















>>> repr([1, 2, 3]) 
[1，2，3] 

>>> repr(1) 

sg 


>>> repr({"lang": "python"}) 
"{'lang': 'python'}" 


使 用 它 写 一 个 小 函数 ， 还 是 作为 多 态 举例 。 


>>> def length(x): 
print "The length of", repr(x), "is", len(x) 


>>> > length( "how are you") 

The length of 'how are you' is 11 

>>> length([1, 2, 3]) 

The length of [1, 2, 3] is 3 

>>> length({"lang":"python", "book":"itdiffer.com"}) 

The length of {'lang': 'python', 'book': 'itdiffer.com'} is 2 


不 过 ， 多 态 也 不 是 万 能 的 ， 如 果 这 样 做 : 


>>> length(7) 
The length of 7 is 
Traceback (most recent call last): 
File "<stdin>", line 1, in <module> 
File "<stdin>", line 2, in length 
TypeError: object of type 'int' has no len() 


报错 了 。 看 错误 提示 ， 明 确 告诉 了 我 们 “object of type'int'has no 
len0”， 也 就 是 说 ， 函 数 lengthO0 中 的 len0 会 对 传 入 的 对 象 进行 检验 ， 如 
nn 
进行 调整 。 


在 诸多 介绍 多 态 的 文章 中 都 会 有 关于 “ 猎 和 狗 ” 的 例子 。 这 里 也 将 代 
色 贴 出 来 ， 读 者 去 体会 所 请 多 态 体 现 。 其 实 ， 如 果 你 进入 了 Python 的 语 
境 ， 有 时 不 经 意 间 束 在 应 用 多 态 特 性 。 














#!/UsSr/bin/env python 
# coding=utf-8 


Li 


the code is from: http://zetcode.com/lang/python/oop/ 


Tr 


_ metaclass _ = type 


class Animal: 
def _ init (self, name = ""): 
self.name = name 
def talk(self): 
pass 


class Cat(Animal): 
def talk(self): 
print "Meow!" 


class Dog(Animal): 
def talk(self): 
print "Woof!" 


a = Animal() 
a.talk() 


c= Cat("Missy") 
c.talk() 


d = Dog("Rocky") 
d.talk() 


保存 后 运行 之 : 


$ python 21101.py 
Meow! 
Woof ! 


代码 中 有 Cat 和 Dog 两 个 类 ， 都 继承 了 类 Animal， 它 们 都 有 talk0 方 
法 ， 输 入 不 同 的 动物 名 称 ， 会 得 出 相应 的 结 


天 于 多 态 ， 有 一 个 被 称 作 “鸭子 类 型 ”duck typeing) 的 东西 ， 其 合 
义 在 维基 百科 中 被 表述 为 : 


在 程序 设计 中 ， 了 鸭子 类 型 〈 英 语 : duck typing) 是 动态 类 型 的 一 种 
风格 。 在 这 种 风格 中 ， 一 个 对 象 有 效 的 语义 ， 不 是 由 继承 自 特定 的 类 或 
实现 特定 的 接口 ， 而 是 由 当前 方法 和 属性 的 集合 决定 。 这 个 概念 的 名 字 
来 源 于 James Whitcomb Riley 提 出 的 鸭子 测试 , “鸭子 测试 ?可 以 这 样 表 
述 :“ 当 看 到 一 只 乌 走 起 来 像 鸡 子 、 游 泳 起 来 像 鸭 子 、 叫 起 来 也 像 鸭 
子 ， 那 么 这 只 乌 就 可 以 被 称 为 鸭子 。” 


最 后 要 提示 读者 ， 类 型 检查 是 毁 掉 多 态 的 利 右 ， 比 如 type、 
isinstance 以 及 isubclass 函 数 ， 所 以 ， 一 定 要 慎 用 这 些 类 型 检查 函数 。 








4.6.2 ”封装 和 私有 化 


在 正式 介绍 封装 之 前 ， 先 讲 个 笑话 。 


东软 件 公司 老板 号 称 目 己 全 技术 。 一 次 有 一 个 项 目 要 交付 给 客户 ， 
他 不 想 让 客户 知道 实现 茶 些 功能 的 代码 ， 但 是 交付 的 时 候 必 须要 给 人 家 
代码 。 于 是 该 老板 就 告诉 程序 员 ,“ 你 们 把 那 部 分 核心 代码 封 效 一 下 ”。 
程序 员 上 听 完 迷茫 了 。 








很 多 人 没有 笑 ， 因 为 不 明白 说 的 是 什么 ， 不 知道 你 有 没有 笑 。 这 种 
幽默 唯一 的 价值 在 于 提 到 了 一 个 词语 “封闭 ”。 


“封装 ?是 不 是 把 代码 写 到 茶 个 东西 里 面 , “人 "在 编辑 器 中 打开 也 看 
不 到 呢 ? 不 是 ， 除 非 你 的 显示 器 坏 了 。 


在 程序 设计 中 ， 封 装 〈Encapsulation) 是 对 对 象 (object) 的 一 种 抽 
象 ， 即 将 某 些 部 分 隐藏 起 来 ， 在 程序 外 部 看 不 到 ， 无 法 调用 (不 是 人 用 
眼睛 看 不 到 那个 代码 ， 除 非 用 某 种 加 密 或 者 混 消 方法 ， 造 成 显示 的 是 一 
堆 混 乱 的 代码 ， 但 这 不 是 封装 ) 。 


要 了 解 封 效 离 不 开 <“ 私 有 化 >， 就 是 将 类 或 者 函数 中 的 东 些 属性 限制 
在 某 个 区 域 之 内 ， 外 部 无 法 调用 ， 所 以 先 说 “私有 化 ”。 


“私有 化 ”"， 顾 名 思 义 ， 就 是 将 某 个 对 象 〈 这 个 对 象 可 以 是 你 认为 的 
东西 ) 限制 在 某 个 目 己 认定 的 范围 内 。 比 如 ， 某 国 经 济 实行 私有 化 ， 就 
征 将 经 鹿 体 系 中 组 成 部 分 分 别 纳入 到 个 人 权限 范畴 ， 而 不 是 放 在 众多 个 
人 无 法 触及 的 领域 〈 那 是 公有 ) ， 或 者 说 ， 私 有 化 就 是 产权 清晰 。 与 之 
对 应 的 是 “公有 ”。 


Python 中 私有 化 的 方法 也 比较 简单 ， 束 是 在 准备 私有 化 的 属性 〈 包 
括 方法 、 数 据 ) 名 字 前 面 加 双 下 画 线 。 例 如 : 





























#!/UsSr/bin/env python 
# coding=utf-8 


_ metaclass _ = type 


class ProtectMe: 
def _ init (self): 
self.me = "qiwsir" 
self. name = "kivi" 


def __python(self): 
print "I love Python." 


def code(self): 
print "Which language do you like?" 
Self, python() 
if name == ”main _" 
p = ProtectMe() 
print p.me 
print p.__name 





$ python 21102 .py 
diwsir 
Traceback (most recent call last): 
File "21102.py", line 21, in <module> 
print p.__name 
AttributeError: 'ProtectMe' object has no attribute '__name' 


查看 报错 信息 ， 告 诉 我 们 没有 `_name` 那 个 属性 。 果 然 隐 藏 了 ， 在 
类 的 外 面 无 法 调用 。 再 试 试 类 里 面 的 那个 code0 是 否 可 以 使 用 ? 把 该 程 
序 做 适当 修改 。 


if name == "__main 
p = ProtectMe() 
p.code() 

p.— python() 





修改 好 之 后 保存 。 其 中 p.code() 的 意图 是 要 打印 出 两 句 话 : “Which 
language do you like?” 和 “I love Python.”，code0) 方 法 和 私有 化 的 
_python0 方 法 在 同一 个 类 中 ， 按 照 私 有 化 的 含义 ， 在 类 里 面 应 该 是 可 
以 调用 的 。 而 p.__pythonO 试 图 通过 实例 在 类 的 外 面 调用 它 。 看 看 效果 : 





$ python 21102.py 
Which language do you like? 
I love Python. 
Traceback (most recent call last): 
File "21102.py", line 23, in <module> 


p.—python() 
AttributeError: 'ProtectMe' object has no attribute '__python' 


如 愿 以 偿 ， 该 调用 的 调用 了 ， 该 隐藏 的 隐藏 了 。 


0 但 是 ， 如 采 要 调用 那些 私有 属性 怎 
么 办 ? 
可 以 使 用 property 函 数 。 请 看 下 面 的 例子 : 
#!/UsSr/bin/env python 
# coding=utf-8 
_ metaclass _ = type 


class ProtectMe: 
def _ init (self): 


self.me = "qiwsir" 
self. name = "kivi" 
@property 


def name(self): 


return self. name 


if name == ”main _" 
p = ProtectMe() 
print p.name 





运行 结 


$ python 21102 .py 


从 上 面 可 以 看 出 ， 用 了 @property 之 后 ， 再 调用 那个 方法 的 时 候 ， 
用 p.name 的 形式 ， 就 好 像 在 调用 以 往 非 私有 化 属性 一 样 。 


看 来 ， 封 装 的 确 不 是 “让 人 看 不 见 ”。 


4.7 ”特殊 属性 和 方法 


在 任何 类 中 ， 都 有 一 些 特殊 的 属性 和 方法 ， 它 们 的 特殊 性 从 表 观 就 
能 看 出 来 ， 通 常 是 用 双 画 线 ”_ ”开头 和 结尾 。 本 书 中 把 它们 归 类 为 特殊 
的 属性 和 方法 ， 之 所 以 特殊 ， 是 因为 它们 跟 你 自己 写 的 或 者 其 他 不 是 
以 “_” 开 头 和 结尾 的 属性 、 方 法 有 所 差异 。 或 许 你 从 事 一 般 开 发 的 项 目 
时 ， 对 这 些 属 性 和 方法 使 用 得 不 多 ， 但 是 我 认为 也 是 有 必要 了 解 的 ， 
为 这 是 你 “From Beginner to Master” 过 程 中 必须 要 迈 出 的 一 步 。 知 道 有 这 
-6 或 许 会 对 你 的 项 目 有 帮助 。 俗 话说 “ 亏 不 压 身 ”， 还 是 认真 了 解 为 
和 











4.7.1 _ dict _ 


要 访问 类 或 者 实例 的 属性 必须 通过 “object.attribute” 的 方式 ， 这 是 我 
们 已 经 熟知 的 了 。 在 这 个 认 知 的 基础 上 ， 请 思考 : 类 或 者 实例 属性 在 
Python 中 是 怎么 存储 的 ? 如 何 修改 、 增 加 、 删 除 属 性 ， 以 及 我 们 能 不 能 
控制 这 些 属性 ? 下 面 就 一 一 道 来 。 





>>> class A(object ) : 
了 pass 


>>> a = Al() 
>>> dir(a) 








['_class ', '_ delattr ', '_dict ', '_doc ', '_ format ', '_ getattribute _ 
>>> dir(A) 
['_class ', '_ delattr ', '_dict ', '_doc ', '_ format ', '_ getattribute _ 








用 dir0 能 够 查看 类 的 属性 和 方法 ， 从 上 面 的 结果 中 可 以 看 出 ， 数 量 
不 少 ， 因 为 我 们 写 的 那个 类 里 面 只 有 pass， 所 以 在 列 出 的 结果 中 ， 都 是 
以 ” ”开头 和 结尾 的 ， 这 些 都 是 所 谓 的 特殊 属性 和 方法 。 


从 众多 的 内 容 中 导 现 出 _dict ， 之 所 以 选 它 ， 是 因为 dict_ 保 存 
了 某 些 机 密 ， 


>>> class Spring(object ) : 
season = "the Spring of class" 


>>> Spring. dict _ 








dict_proxy({'__dict ': <attribute '_ dict ' of 'Spring' objects>, 

'season': 'the Spring of class', 

module ': '_ main _', 

'_ weakref ': <attribute ' weakref ' of 'Spring' objects>, 
'_doc _': None}) 








为 了 便于 观察 ， 将 上 面 的 显示 结果 进行 了 换行 ， 每 个 键 / 值 对 一 
行 。 





从 现实 的 结果 中 可 以 友 现 ， 有 一 个 键 “season”， 它 是 这 个 类 的 属 
性 ;其 值 就 是 类 属性 的 数据 。 


>>> Spring._ dict ['season'] 
"the Spring of class' 

>>> Spring.season 

"the Spring of class' 








Spring. dict _['season'] 意 思 是 访问 类 属性 ， 这 是 看 到 上 述 结果 为 字 
典 类 型 而 想到 的 ， 男 外 一 个 我 们 熟悉 的 方式 束 是 通过 点 号 ， 也 一 样 能 够 
实现 同样 的 效果 。 


下 面 将 这 个 类 实例 化 ， 再 看 看 它 的 实例 属性 : 


>>> s = Spring() 
>>> s._ dict _ 


{} 


实例 属性 的 _dict 是 空 的 。 有 点 奇怪 ? 不 奇怪 ， 接 着 看 : 


>>> s.season 
"the Spring of class' 





s.season 应 该 是 指 同 了 类 属性 中 的 Spring.season， 人 至 此 ， 我 们 其 实 还 
没有 建立 任何 实例 属性 。 下 面 就 建立 一 个 实例 属性 : 


>>> s.season = "the Spring of instance" 
>>> s._dict _ 
{'season': 'the Spring of instance'} 





这 样 ， 实 例 属 性 里 面 就 不 空 了 。 这 时 候 建 立 的 实例 属性 和 上 面 的 那 


个 S.sSeason 重 名 ， 并 且 把 原来 的 * 遮 盖 ” 了 。 这 人 句 好 是 不 是 熟悉 ? 因为 在 讲 
述 “ 实 例 属性 ”和 “类 属性 ”的 时 候 束 提 到 了 ， 现 在 读者 肯定 理解 更 深入 
Ts 


>>> s._ dict ['season'] 
"the Spring of instance' 
>>> s.season 

"the Spring of instance' 


此 时 ， 那 个 类 属性 如 何 ? 我 们 看 看 : 


>>> Spring._ dict ['season'] 

"the Spring of class' 

>>> Spring. dict _ 

dict proxy({'_ dict ': <attribute ' dict ' of 'Spring' objects>, 'season': 'the 
>>> Spring.season 

'the Spring of class' 


Spring 的 类 属性 没有 受到 实例 属性 的 影响 。 


按照 前 面 讲述 的 类 属性 和 实例 属性 的 操作 ， 如 果 将 实例 属性 
(s.season) 删除 ， 会 不 会 回 到 实例 属性 s._ dict_ 为 空 呢 ? 


>>> del s.season 

>>> s._dict _ 

>>> s.season 

'the Spring of class' 


果然 打 回 原型 。 


本 你 可 以 定义 其 他 名 称 的 实例 属性 ， 它 一 样 被 存储 到 _dict 
里 面 : 


>>> s.lang = "python" 
>>> s._dict _ 
{'lang': 'python'} 
>>> s._ dict ['lang'] 








诚然 ， 这 样 做 仅仅 是 更 改 了 实例 的 _ dict_ 内容， 对 Spring. dict 
无 任何 影响 ， 也 就 是 说 通过 Spring.lang 或 者 Spring. dict_["lang"] 是 得 不 
到 上 述 结果 的 。 


>>> Spring,1Lang 
Traceback (most recent call last): 
File "<stdin>", line 1, in <module> 
AttributeError: type object 'Spring' has no attribute 'lang' 
>>> Spring._ dict ['lang'] 
Traceback (most recent call last): 
File "<stdin>", line 1, in <module> 
KeyError: 'lang’ 


， 如 果 这 样 操作 ， 会 怎样 呢 ? 


>>> Spring,.flower = "peach" 

>>> Spring. dict _ 

dict_proxy({' module ': '_ main _', 

'flower': 'peach', 

'season': 'the Spring of class', 

'_dict ': <attribute '_ dict ' of 'Spring' objects>, '_ weakref _': <attribute ' 
>>> Spring._ dict _['flower'] 

'peach' 





类 的 _dict_ 被 更 改 了 ， 类 属性 中 增加 了 一 个 flower 属 性 。 但 是 ， 实 
例 的 _dict_ 中 如 何 ? 


>>> s._dict 
{'lang': 'python'} 


没有 被 修改 。 然 而 ， 还 能 这 样 : 


>>> s.flower 
'peach' 





这 个 读者 是 人 否 能 解释 ?其 实 又 回 到 了 前 面 第 一 个 出 现 s.season 上 面 
可 


通过 上 面 的 探讨 ， 是 不 是 基本 理解 了 实例 和 类 的 _ dict ， 并 且 也 
看 到 了 属性 的 变化 特点 。 特 别 是 ， 这 些 属性 都 是 可 以 动态 变化 的 ， 即 你 
可 以 随时 修改 和 增删 。 


属性 如 此 ， 方 法 呢 ? 下 面 就 看 看 方法 〈 类 中 的 函数 ) 。 





>>> class Spring(object ) : 

def tree(self, x): 
self,x = x 

return self.x 


>>> Spring. dict _ 
dict_ proxy({'_ dict ': <attribute '_dict ' of 'Spring' objects>, 


' weakref ': <attribute ' Weakref _' 
! moouke ': ' main 

'tree': <function tree at Oxb748fdf4>, 

' doc ': None}) 


of 'Spring' objects>, 





>>> Spring._ dict ['tree' 
<function tree at 0xb748fdf4> 


结果 跟前 面 讨论 属性 差不多 ， 方 法 tree0 也 在 _、 dict 里面 。 


>>> t = Spring() 
>>> t._ dict _ 


{} 


又 跟前 面 一 样 。 虽 然 建立 了 实例 ， 但 是 在 实例 的 _dict_ 中 没有 方 
法 。 接 下 来 执行 : 


>>> t.tree("xiangzhangshu") 
"Xiangzhangshu' 








还 记得 前 面 茶 章 东 节 有 一 幅 曾 述 “ 数 据 流转 ?的 图 吗 ， 其 中 显示 非常 
明确 ， 当 用 上 面 的 方式 执行 方法 的 时 候 ， 实 例 t 与 self 建 立 了 对 应 关系 ， 
两 者 是 一 个 外 一 个 内 。 在 方法 中 self.x=x， 将 x 的 值 给 了 self,x， 也 就 是 实 
例 应 该 拥有 这 么 一 个 属性 。 


>>> t._ dict _ 
{'x': 'xiangzhangshu'} 


末 然 如 此 。 这 也 印证 了 实例 t 和 self 的 关系 ， 即 实例 方法 
(t.tree ('xiangzhangshu') ) 2 一 个 参数 (self， 但 没有 写 出 来 ， 绑 害 
实例 t， 透 过 self.x 来 设 定 值 ， 给 t._dict_ 添加 属性 值 。 


换 一 个 角度 再 看 看 : 


>>> Class Spring(object ) : 
def tree(self, x): 
return x 


这 个 方法 中 没有 将 x 赋值 给 self 的 属性 ， 而 是 直接 returm， 结 果 是 : 


>>> s = Spring() 

>>> s.tree("liushu") 
'liushu' 

>>> s._dict 


{} 





是 不 是 理解 更 深入 了 ? 

现在 需要 对 Python 中 的 一 个 观点 :“ 一 切 此 对 象 ”? 再 深入 领悟 。 以 上 
不 管 是 类 还 是 实例 的 属性 和 方法 ， 都 符合 objectattribute 格 式 ， 并 且 属 性 
类 似 。 


当 你 看 到 这 里 的 时 候 ， 要 么 明白 了 类 和 实例 的 _dict_ 的 特点 ， 要 
么 就 糊涂 了。 糊涂 也 不 要 紧 ， 再 将 上 面 的 重复 一 所 ， 特 别 要 自己 痪 一 禹 
有 关 代 码 。 

需要 说 明 ， 我 们 对 _dict_ 的 探讨 还 留 有 一 个 尾巴 一 一 属性 搜索 路 
径 。 这 个 留 在 后 面 讲述 。 


不 管 是 类 还 是 实例 ， 其 属性 都 能 随意 增加 ， 有 时 这 不 是 一 件 好 事 
情 ， 或 许 在 东 些 时 候 你 不 希望 别人 增加 属性 。 有 办 法 吗 ? 当然 有 ， 请 继 


续 学 习 。 








4.7.2 Slots 





slots_ 能 够 限制 属性 的 定义 ， 但 是 这 不 是 它 存 在 的 终极 目标 ， 它 
存在 的 终极 目标 应 该 是 在 编程 中 非常 重要 的 一 个 方面 ， 优 化 内 存 使 用 。 
在 东 些 编程 中 ， 优 化 内 存 是 非常 重要 的 ， 万 万 不 可 忽视 。 








>>> Class Spring(object ) : 

。 Slots = ("tree", "flower") 

>>> dir(Spring) 

['_class ', '_ delattr ', '_doc ', '_ format ', '_ getattribute ', '__hash 











仔细 看 看 dir() 的 结果 ， 还 有 _dict_ 属性 吗 ? 没有 了 。 也 就 是 说 
_ slots_ 把 _dict_ 挤 出 去 了 ， 返 回来 看 看 ， 没 有 _ slots _， 现 在 它 进 入 
了 类 的 属性 。 


>>> Spring. slots _ 
('tree', 'flower') 





从 这 里 可 以 看 出 ， 关 Spring 有 且 仪 有 两 个 属性 ， 并 且 返 回 的 是 一 个 
元 组 对 象 。 


>>> t = Spring() 
>>> t._ Slots_ _ 
('tree', 'flower') 


实例 化 之 后 ， 实 例 的 _slots_ 与 类 的 完全 一 样 ， 这 跟前 面 的 
_dict 大 不 一 样 了 。 


>>> Spring.tree = "liushu" 


通过 类 ， 先 赋予 一 个 属性 值 。 然 后 检验 一 下 实例 能 人 否 修改 这 个 属 
性 : 


>>> t.tree = "guangyulan" 
Traceback (most recent call last): 
File "<stdin>", line 1, in <module> 
AttributeError: 'Spring' object attribute 'tree' is read-only 


看 来 ， 我 们 的 意图 不 能 达成 ， 报 错 信息 中 显示 tree 这 个 属性 是 只 读 
的 ， 不 能 修改 。 


>>> t.tree 
" Lushu' 








因为 前 面 已 经 通过 类 给 这 个 属性 赋值 了 ， 不 能 用 实例 属性 来 修改 。 
只 能 : 


>>> Spring.tree = "guangyulan" 
>>> t.tree 
"guangyulan 


用 类 属性 修改 。 但 是 对 于 没有 用 类 属性 赋值 的 ， 可 以 通过 实例 属 


>>> t.flower = "haitanghua" 
>>> t.flower 
"haitanghua' 


此 时 : 


>>> Spring.flower 
<member 'flower' of 'Spring' objects> 


实例 属性 的 值 并 没有 传 回 到 类 属性 ， 你 也 可 以 理解 为 新 建立 了 一 个 
同名 的 实例 属性 。 如 果 再 给 类 属性 赋值 ， 那 么 就 会 这 样 了 : 
>>> Spring.flower = "ziteng" 


>>> t.flower 
"Ziteng 


当然 ， 此 时 再 给 Lflower 重 新 赋值 ， 就 会 报 出 跟前 面 一 样 的 错误 。 


>>> t.water = "green" 
Traceback (most recent call last): 
File "<stdin>", line 1, in <module> 
AttributeError: 'Spring' object has no attribute 'water' 


这 里 试图 给 实例 新 增 一 个 属性 ， 也 失败 了 。 


看 来 slots_“ 己 经 把 实例 属性 定年 地 管控 了 起 来 ， 但 更 本 质 的 是 优 
化 了 内 存 。 诚 然 ， 这 种 优化 会 在 有 大 量 的 实例 时 显 出 效果 。 








47.3 ”getattr 、_ setattr 和 其 他 类 似 方法 


结合 4.7.2 节 内 容 ， 看 一 个 例子 : 


>>> class A(object ) : 
pass 
>>> a = A() 
>>> a.x 
Traceback (most recent call last): 
File "<stdin>", line 1, in <module> 
AttributeError: 'A' object has no attribute 'x' 





x 不 是 实例 的 成 员 (“成 员 ” 宠 统 指 类 的 属性 和 方法 ) ， 用 a.x 访 问 一 
定 会 报错 ， 这 是 大 家 所 共 知 的 ， 错 误 提 示 中 报告 了 原因 : “'Al'object has 
no attribute'x'”” 


也 就 是 说 ， 如 果 访 问 a.x， 它 不 存在 ， 那 么 就 要 转向 到 茶 个 操作 。 我 
们 把 这 种 情况 称 之 为 “拦截 >。 在 Python 中 ， 方 法 就 具有 这 种 “拦截 * 能 








ak 


。 setattr (self，name，value) : 如 果 要 给 name 赋 值 ， 就 调用 这 
个 万: 于 

。 ”getattr (self，name) : 如 果 name 被 访问 ， 同 时 它 不 存在 ， 此 
方法 被 调用 。 

。 getattribute (self，name) : 当 name 被 访问 时 上 自动 被 调用 〈 注 
意 : 这 个 仅 能 用 于 新 式 类 ) ， 无 论 name 是 否 存在 ， 都 要 被 调用 。 

。 delattr (self，name) : 如 果 要 删除 name， 这 个 方法 束 被 调 
用 。 


下 面 用 例子 说 明 。 








>>> class A(object ) : 
def geLatLT 一 (self, name): 
print "You use getattr" 
def _ setattr (self, name, value): 
print "You use setattr" 
Self, dict [name] = value 





类 A 是 新 式 类 ， 除 了 两 个 方法 ， 没 有 别 的 属性 。 


>>> a = A() 
>>> a.x 
You use getattr 


依然 调用 了 不 存在 的 属性 a.x， 按 照 开 头 的 例子 是 要 报错 的 。 但 是 ， 
由 于 在 这 里 使 用 了 __getattr (self，name) 方法 ， 当 发 现 x 不 存在 于 对 
象 的 _dict_ 中 时 ， 融 调用 了 __getattr_ “拦截 成 员 ”。 





>>> a,X = 7 
You Use setattr 


给 对 象 的 属性 赋值 时 ， 调 用 了 setattr (self，name，value) 方 
法 ， 这 个 方法 中 有 一 句 self.， dict” [name]=value， 通 过 这 个 语句 ， 束 将 
属性 和 数据 保存 到 了 对 象 的 _dict_ 中， 如果 再 调用 这 个 属性 : 








>>> a.x 
7 





x 已 经 存在 于 对 象 的 _dict 之 中 。 


在 上 面 的 类 中 ， 当 然 可 以 使 用 ”getattribute (self，name) ， 因 为 
它 是 新 式 类 ， 并 且 ， 只 要 访问 属性 就 会 调用 它 。 例 如 : 





>>> class B(object): 
def _ getattribute (self, name): 
print "you are useing getattribute" 
return object. getattribute (self, name) 


为 了 与 前 面 的 类 区 分 ， 重 新 搞 一 个 类 ， 在 类 的 方法 _etattribute_() 
中 使 用 return object._ getattribute_ (self, name) 。 


再 来 访问 一 个 不 存在 的 属性 


>>> b = B() 
>>> b.y 
you are useing getattribute 
Traceback (most recent call last): 

File "<stdin>", line 1, in <module> 

File "<stdin>", line 4, in _ getattribute _ 
AttributeError: 'B' object has no attribute 'y' 
>>> b.two 
you are useing getattribute 
Traceback (most recent call last): 

File "<stdin>", line 1, in <module> 

File "<stdin>", line 4, in _ getattribute _ 
AttributeError: 'B' object has no attribute "two' 








访问 不 存在 的 成 员 ， 立 刻 被 _ getattribute “拦截 了 ， 虽 然 最 后 还 是 
要 报错 的 。 


>>> b.y = 
>>> b.y 
you are useing getattribute 





当 给 其 赋值 后 ， 意 味 着 其 已 经 在 _ dict 里 面 了 ， | 依然 被 
拦截 ， 但 是 由 于 其 已 经 在 _dict 内 ， 所 以 会 把 结果 返 

特别 注意 ， 在 这 个 方法 中 ， 没 有 使 用 return self._ dict 3 
为 如 果 用 这 样 的 方式 就 是 访问 self.，dict ， 只 要 访问 类 的 某 个 属性 ， 就 
要 调用 getattribute”， 这 样 束 会 导致 无 限 递 归 下 去 ( 死 循 环 ) 。 要 避 
i 

当 你 看 到 这 里 ， 是 不 是 党 得 上 面 的 方法 有 点 魔力 呢 ? 在 理解 前 述 内 
































容 的 基础 上 ， 再 认真 阅读 下 面 的 代码 ， 会 体会 到 在 实践 中 的 应 用 。 


#!/UsSr/bin/env python 
# Coding=utf-8 


study _ getattr _and setattr_ _ 


class Rectangle(object): 


the width and length of Rectangle 

def _ init (self): 

self.width = 0 

self.length = 0 
def setSize(self, size): 

self.width, self.length = size 
def getSize(self): 

return self.width, self.length 





if name == "_ main _": 
r = Rectangle() 
r.width = 3 


r.length = 4 

print r.getSize() 
r.setSsize( (30, 40) ) 
print r.width 

print r.length 


上 面 的 代码 来 自 《Beginning Python:From Novice to Professional， 
Second Edittion》 (by Magnus Lie Hetland) ， 根 据 本 教程 的 需要 ， 稍 有 
修改 。 


$ python 21301.py 
(3, 4) 

30 

40 





这 上 段 代码 已 经 可 以 正确 运行 了 ， 但 是 ， 作 为 一 个 精 荔 求 精 的 程序 
员 ， 总 觉得 那 种 调用 方式 还 有 可 以 改进 的 空间 。 比 如 ， 要 给 长 宽 赋 值 的 
时 候 ， 必 须 赋 予 一 个 元 组 ， 里 面包 含 长 和 宽 。 这 个 能 不 能 改进 一 下 呢 ? 


#!/UsSr/bin/env python 
# coding=utf-8 
class Rectangle(object): 
def _ init (self): 
self.width = 0 
self.length = 0 
setSize(self, size): 
self.width, self.length = size 
def getSize(self): 
return self.width, self.length 


de 


下 


size = property(getSize, setSize) 





if name == "main _": 
r = Rectangle() 
r.width = 3 


r.length = 4 
print r.size 
r.size = 30, 40 
print r.width 
print r.length 


以 上 代码 中 因为 加 了 一 句 size=property (getSize，setSize) ， 使 得 
bai 0 了 。 原 来 用 r.getSize0， 现 在 使 用 r.size， 就 好 像 调用 一 
全 属性 一 件 。 


里 然 优 化 了 上 面 的 代码 ， 但 是 还 没有 和 本 市 讲述 的 特殊 方法 拉 上 关 
系 ， 所 以 ， 还 要 继续 改写 。 


#!/UsSr/bin/env python 
# coding=utf-8 


class NewRectangle(object): 
def _ init (self): 
self.width = 0 
self.length = 0 





def _ setattr_ (self, name, value): 
if name == "size": 
self.width, self.length = Value 
else: 
self,_ dict [name] = value 
def _ getattr_ (self, name): 
If name == "size": 
return self.width, self.length 
else: 
raise AttributeError 
if name == "_ main _ _": 
r = NewRectangle() 
r,width = 3 


r.length = 4 
print r.size 
r.size = 30, 40 
print r.width 
print r.length 


除了 类 的 样式 变化 之 外 ， 调 用 样式 没有 变 ， 结 果 是 一 样 的 。 


4.7.4 获得 属性 顺序 





通过 实例 获取 其 属性 ， 如 果 在 _ dict_ 中 有 ， 就 直接 返回 其 结果 ; 
如 果 没 有 ， 会 到 类 属性 中 找 。 比 如 : 





#!/UsSr/bin/env python 
# coding=utf-8 


class A(object ) : 
author = "qiwsir" 
def _ getattr_ (self, name): 
If name != "author": 
return "from starter to master." 


if name == ”main _" 
a=A() 
print a.author 
print a.lang 





\ 一 J 二 了 生 口 
运行 程序 : 
$ python 21302.py 


diwsir 
from starter to master. 


当 a=AO 后 ， 并 没有 为 实例 建立 任何 属性 ， 或 者 说 实例 的 _、dict 是 
空 的 〈 意 思 是 说 没有 某 些 属性 值 ) 。 但 是 如 果 要 查看 aauthor， 因 为 实 
例 的 属性 中 没有 ， 上 所 以 束 去 类 属性 中 找 ， 发 现 果 然 有 ， 于 是 返回 其 值 
qiwsir。 但 是 ， 找 alang 时 候 ， 不 仅 实例 属性 中 没有 ， 类 属性 中 也 没有 ， 
于 是 就 调用 了 __getattr_() 方 法 。 科 好 在 这 个 类 中 有 这 个 方法 ， 如 果 没 
有 _ getattr (0) 方 法 呢 ? 如 果 没 有 定义 这 个 方法 ， 就 会 引发 
AttributeError。 


这 就 是 通过 实例 碍 找 特性 的 顺序 。 














48 TETCE 


友 代 对 于 读者 已 经 不 陌生 了 ， 已 经 多 次 看 到 这 个 词语 并 对 其 有 了 初 
步 解 了 。 


我 们 已 经 知道 ， 对 序列 《列表 、 元 组 ) 、 字 典 和 文件 都 可 以 用 iter0) 
方法 生成 迭代 对 象 ， 然 后 用 next() 方 法 访问 。 当 然 ， 这 种 访问 不 是 自动 
的 ， 如 果 用 for 循 环 ， 就 可 以 自动 完成 上 述 访问 了 。 


如 果 用 dir (list) 、dir (tuple) 、dir (file) 、dir (dict) 来 查看 不 
同类 型 对 象 的 属性 ， 会 发 现 它们 都 有 一 个 名 为 _iter_ 的 东西 。 这 应 该 
引起 读者 的 关注 ， 因 为 它 和 迭代 器 (iterator) 、 内 置 的 函数 iter0 在 名 字 
上 很 像 ， 除 了 前 后 的 双 下 男 线 。 望 文生 义 ， 我 们 也 能 猜 出 它 肯 定 是 跟 迭 
代 有 关 的 东西 。 当 然 ， 这 种 猜测 也 不 是 没有 根据 的 ， 其 重要 根据 就 是 英 
文 单词 ， 如 果 它 们 之 间 没 有 一 点 和 关系， 肯定 不 会 将 命名 设置 的 一 样 。 


是 的 ，_iter 就 是 对 象 的 一 个 特殊 方法 ， 它 是 迭代 规则 (iterator 
potocol) 的 基础 。 或 者 说 ， 如 果 对 象 没 有 它 ， 束 不 能 返回 迭代 器 ， 吏 没 
有 next(0 方 法 ， 融 不 能 迭代 。 


如 果 读 者 用 的 是 Python 3.x， 和 迭代 堪 对 象 实现 的 是 _next (方法 ， 
不 是 next(D。 并 且 ， 在 Python 3.x 中 有 一 个 内 建 函 数 next0， 可 以 实现 
next (it) ， 访 问 迭 代 器 ， 这 相当 于 Python 2.x 中 的 it.next() (it 是 迭代 对 
象 ) 。 














4.8.1 _ iter 0() 


类 型 是 list、tuple、file、dict 的 对 象 有 __iter _() 方 法 ， 标 志 痢 它们 能 
够 迭代 。 这 些 类 型 都 是 Python 中 国有 的 ， 我 们 能 不 能 自己 写 一 个 对 象 ， 
让 它 能 够 迭代 呢 ? 


#!/UsSr/bin/env python 
# coding=utf-8 


class MyRange(object ) : 
def _ init _ os n): 
self.i 
self.n 
def _ iter_ _ ee 
return self 
next(self): 
if self.i < self.n: 
i = self.i 
self,i += 1 
return i 
else: 
raise StopIteration() 


de 


-+h 


if name == ”main ": 
x = MyRange(7) 
print "x.next()==>", x.next() 
print "x.next()==>", x.next() 
print "------ for loop-------- 
for i in x: 
print i 





将 代码 保存 并 运行 ， 结 果 是 : 


$ python 21401.py 
x.next()==> 0 
x.next()==> 1 

------ for lJoop-------- 





以 上 代码 的 含义 ， 是 自己 仿 写 了 拥有 range() 的 对 象 ， 这 个 对 象 是 可 
友人 代 的 ， 分 析 如 下 。 


(1) _iter_ 0 是 类 中 的 核心 ， 它 返回 了 友 代 器 本 身 ， 实 现 了 
_ iter__(0) 方 法 的 对 象 ， 即 意味 着 其 可 迭代 。 


(2) 含有 next() 的 对 象 就 是 迭代 器 ， 并 且 在 这 个 方法 中 ， 在 没有 元 
素 的 时 候 要 发 起 Stoplteration0) 异 第 。 


对 以 上 类 的 调用 换 一 种 方式 : 





if name == "__ main _": 
x = MyRange(7) 
print list(x) 





print "x.next()==>", x.next() 


运行 后 会 出 现 如 下 结果 : 


$ python 21401.py 
[0, 1, 2, 3, 4, 5, 6] 
x.next( )==> 
Traceback (most recent call last): 
File "21401.py", line 26, in <module> 
print "x.next()==>", x.next() 
File "21401.py", line 21, in next 
raise StopIteration() 
StopIteration 


说 明 什 么 呢 ? print list (x) 将 对 象 返 回 值 都 装 进 了 列表 中 并 打印 出 
来 ， 这 个 正常 运行 了 。 最 终 ， 指 针 移 动 到 了 迭代 对 象 的 最 后 一 个 ， 
next() 方 法 没有 检测 ， 也 不 知道 是 不 是 要 停止 了 ， 它 还 要 继续 下 去 ， 当 
继续 下 一 个 的 时 候 ， 才 发 现 没 有 元 素 了 了， 于 是 返回 了 StopIteration()。 


为 什么 要 用 这 种 可 友 代 的 对 象 呢 ? 吏 像 上 面 的 例子 一 样 ， 列 表 不 是 
挺 好 的 吗 ? 


列表 的 确 非常 好 ， 在 很 多 时 候 效率 很 高 ， 并 且 能 够 解决 很 多 普 过 的 
问题 。 但 是 ， 不 要 起 记 ， 在 某 些 时 候 ， 列 表 可 能 会 给 你 带 来 灾难 。 因 为 
在 你 使 用 列表 的 时 候 ， 需 要 将 列表 内 容 一 次 性 都 读 入 到 内 存 中 ， 这 样 束 
增加 了 内 存 的 负担 。 如 条 列表 太 大 ， 束 有 内 存 洪 出 的 危险 了 ， 这 时 候 就 
需要 人 迭代 对 象 。 比 如 斐 波 那 契 数列 : 


























#!/UsSr/bin/env python 
# coding=utf-8 


_ metaclass _ = type 


class Fibs: 
def _ init (self, max): 
self.max = max 
self.a = 0 
self.b = 1 


def _ iter_ (self): 
return self 


def next(self): 
fib = self.a 
If fib > self.max: 
raise StopIteration 
self.a, self.b = self.b, self.a + self.b 
return fib 


if name == "”_ main 
fibs = Fibs(5) 
print list(fibs) 





运行 结果 是 : 


$ python 21402 .py 
[90, 1, 1, 2, 3, 5] 


给 读者 一 个 思考 问题 ， 要 在 斐 波 那 问 数列 中 找 出 大 于 1000 的 最 小 的 
数 ， 能 不 能 在 上 述 代码 的 基础 上 改造 得 出 呢 ? 


4.8.2 range() 和 xrangel() 





关于 列表 和 迭代 堪 之 间 的 区 别 还 有 两 个 非常 典型 的 内 建 函 数 : 
range0 和 xrange(0， 研 究 一 下 这 两 个 内 建 函 数 的 差异 ， 会 有 所 收获 的 。 


range(...) 
range(stop) -> list of integers 
range(start, stop[, step]) -> list of integers 
>>> dir(range) 
['_call ', '_class ', '_ Ccmp ', '_ delattr ', '_doc ', ' eq j fo 








从 range() 的 帮助 文档 和 方法 中 可 以 看 出 ， 它 的 结果 是 一 个 列表 。 但 
是 ， 如 果 用 help (xrange) 查看 : 


class xrange(object ) 
xrange(stop) -> xrange object 
xrange(start, stop[, step]) -> xrange object 


generates the numbers in the range on demand. For looping, this is 


| 
| 
| Like range(), but instead of returning a list, returns an object that 
| 
| slightly faster than range() and more memory efficient. 


xrange0 返 回 的 是 对 象 ， 类 似 range0， 但 不 是 列表 。 在 循环 的 时 
候 ， 它 跟 range() 相 比 “slightly faster than range(Oand more memory 
efficient”( 稍 快 并 具有 更 高 的 内 存 效率 ) 。 碍 看 它 的 方法 : 


>>> dir(xrange) 


['_class ', '_ delattr ', '_doc ', '_ format ', '_ getattribute ', '_ getite 








看 到 令 人 兴奋 的 _iter _ 了 吗 ? 说 明 它 是 可 迭代 的 ， 它 返回 的 是 一 


个 可 迭代 的 对 象 。 


也 就 是 说 ， 通 过 range() 得 到 的 列表 会 一 次 性 被 读 入 内 存 ， 而 
xrange() 返 回 的 对 象 ， 则 需要 一 个 数值 才 返 回 一 个 数值 。 看 一 个 把 zip() 
牵扯 进来 的 例子 。 


>>> zip(range(4), xrange(100000000)) 
[(90, 0), (1, 1), (2, 2), (3, 3)] 


第 一 个 range (4) 产生 的 列表 被 读 入 内 存 ; 第 二 个 很 长 ， 但 是 不 用 
担心 ， 它 根本 不 会 产生 那么 长 的 列表 ， 因 为 只 需要 前 4 个 数值 ， 它 就 提 
供 前 4 个 数值 。 如 果 你 要 修改 为 range (100000000) ， 就 要 花费 时 间 
J EDs; 


迭代 器 的 确 有 迷人 之 处 ， 但 是 它 也 不 是 万 能 之 物 。 比 如 迭代 器 不 能 
回 退 ， 只 能 如 过 河 的 鞭子 ， 不 断 癌 前 。 另 外 ， 和 闪 代 器 也 不 适合 在 多 线程 
环境 中 对 可 变 集 合 使 用 。 


4.9 ”生成 器 


生成 器 〈generator) 是 一 个 非常 迷人 的 东西 ， 也 常 被 认为 是 Python 
的 高 级 编程 技能 。 我 很 乐意 在 这 里 跟 读 者 探讨 这 个 话题 ， 因 为 我 相信 读 
者 看 本 书 的 目的 绝 非 仅仅 将 自己 限制 于 初学 着 水 十 ， - 定 有 一 里 不 甘 的 
心 一 一 要 成 为 Python 高 手 。 于 是 平 ， 需 要 了 解 生 成 占 。 


“从 代 器 ”已 经 是 很 熟悉 了 吧 ? 生成 器 和 从 代 器 有 着 一 定 的 渊源 。 首 
先生 成 器 必须 是 可 迭代 的 ， 但 它 又 不 完全 等 同 于 迭代 融 。 














4.9.1 人 简单 的 生成 右 


>>> my_generator = (x*x for x in range(4)) 





这 是 不 是 跟 列表 解析 很 类 似 呢 ?仔细 观察 ， 它 不 是 列表 ， 像 下 面 这 
样 得 到 的 才 是 列表 : 


>>> my_list = [x*x for x in range(4)] 











以 上 两 者 的 区 别 在 于 前 者 是 方 括号 “[" 后 者 是 圆 括号 “0”， 虽 然 是 细 
小 的 差别 ， 但 是 结果 完全 不 一 样 。 


>>> dir(my_ generator) 
d 




















['_ class _', elattr ', '_doc ', '_ format ', '_ getattribute ', '__hash 
'__iter _' 

'_ name ', '_new ', '_reduce ', '_reduce ex ', '_repr_ _', '_ setattr ', '_ 
next ， 

'send', 'throw'] 





为 了 容易 观察 ， 将 原来 得 到 的 结果 进行 了 重新 排版 。 是 不 是 发 现 了 
在 迭代 右 中 必 有 的 方法 _ inter_ (和 next()? 这 说 明 my_generator 是 可 迭 
代 的 ， 可 以 用 for 循 环 来 依次 读 出 其 值 。 


>>> for i in my_generator: 


print i 


0 

工 

4 

9 

>>> for i In my_generator: 
print i 


当 第 一 遍 循 环 的 时 候 ， 将 my_generator 皇 面 的 值 依次 读 出 并 打印 ， 
但 是 ， 知 再 读 一 次 ， 就 发 现 没 有 任何 结果 “游标 已 经 移动 到 最 后 了 ) ， 
这 种 特性 也 正 是 迭代 器 所 具有 的 。 


如 果 对 那个 列表 ， 萄 不 一 样 了 : 





>>> for i in my_list: 
print i 


0 
1 
4 
9 
>>> for i in 人 list: 
print i 


难道 生成 絮 束 是 把 列表 解析 中 的 “[]” 换 成 “<0” 这 么 简单 吗 ? 这 仅仅 是 
生成 旨 的 一 种 表现 形式 和 基本 使 用 方法 轻 了， 仿照 列表 解析 式 的 命名 ， 
可 以 称 之 为 “生成 费解 术 式 ”( 或 者 : 生成 器 推导 式 、 生 成 喜 表 达 式 ) 。 


生成 旨 解 析 式 有 很 多 用 途 ， 在 不 少 地 方 可 以 丛 代 列表 解析 ， 特 别 是 
针对 大 数据 的 时 候 ，Python 处 理 列 表 时 ， 将 全 部 数据 都 读 入 到 内 存 ， 而 
迭代 器 《生成 器 是 友 代 圳 ) 的 优势 吏 在 于 只 将 所 需要 的 读 入 内 存 里 ， 因 
此 生成 旨 解 析 式 比 列表 解析 式 少 占 内 存 ， 再 看 实例 : 





>>> sum(i*1i for i In range(10)) 
285 


这 个 例子 是 计算 1 到 10 以 内 的 自然 数 的 平方 和 ， 请 观察 sum0) 运 算 ， 
这 样 做 是 不 是 感觉 很 迷人 ? 如 果 是 列表 ， 你 不 得 不 : 








>>> sum([i*i for i in range(10)]) 


285 





里 然 生 成 器 解析 式 貌 似 不 错 ， 但 是 对 其 真正 的 含义 ， 还 需要 我 们 做 
深入 探 守 才能 揭晓 。 


4.9.2 ”定义 和 执行 过 程 








yield 这 -了 个 词 在 汉语 中 有 “生产 、 出 产 ” 之 意 ， 在 Python 中 ， 它 作为 一 
个 关键 词 变量、 函数 、 类 的 名 称 中 不 能 用 它 来 命名 ) ， 是 生成 器 的 标 


JU o 


>>> def g(): 
yield 0 
yield 1 
yield 2 
>>> g 
<function g at Oxb71if3b8c> 


建立 了 一 个 非常 简单 的 函数 ， 跟 以 往 看 到 的 函数 唯一 不 同 的 地 方 是 
用 了 三 个 yield 语 句 。 然 后 进行 下 面 的 操作 : 


>>> ge = g() 

>>> ge 

<generator object g at Oxb7200edc> 
>>> type(ge) 

<type 'generator'> 


上 面 建立 的 函数 返回 值 是 一 个 生成 妖 (generator〉 类 型 的 对 象 。 


>>> dir(ge) 











['_class ', '_ delattr ', '_doc ', '_ format ', '_ getattribute ', '__hash 


在 这 里 看 到 了 __iter_() 和 next()， 说 明 它 是 迭代 器 。 既 然 如 此 ， 当 
然 可 以 : 


>>> ge.next() 
0 
>>> ge.next() 
工 
>>> ge.next() 
2 


>>> ge.next() 


Traceback (most recent call last): 
File "<stdin>", line 1, in <module> 
StopIteration 





从 例子 中 可 以 看 出 ， 含 有 yield 关 键 词 的 函数 是 一 个 生成 器 类 型 的 对 
象 ， 这 个 生成 器 对 象 是 可 和 迭代 的 。 


我 们 把 含有 yield 语 句 的 函数 称 作 生成 堪 ， 生 成 器 是 一 种 用 普通 函数 
语法 定义 的 迭代 器。 

通过 上 面 的 例子 可 以 看 出 ， 这 个 生成 器 在 定义 过 程 中 并 没有 显 化 地 
使 用 _ inter _(0 和 nextO0， 而 是 只 要 用 了 yield 语 句 〈yield 关 键 词 发 起 的 语 
人 0 也 惑 具 备 了 迭代 器 的 功 
能 特性 。 


yield 语 名 的 作用 惑 是 在 调用 的 时 候 返 回 相 应 的 值 。 下 面 详 细 训 析 一 
下 上 面 的 运行 过 程 。 


e 0 除了 返回 生成 器 之 外 ， 什 么 也 没有 操作 ， 任 何 值 也 没有 被 
J 这 国 。 

。 ge.next(): 直到 这 时 候 ， 生 成 器 才 开 始 执行 ， 遇 到 了 第 一 个 yield 语 
句 ， 将 值 返 回 ， 并 暂停 执行 (有 的 称 之 为 挂 起) 。 

。 ge.next(): 从 上 次 暂停 的 位 置 开始 ， 继 续 同 下 执行 ， 巡 到 yield 语 
句 ， 将 值 返 回 ， 叉 暂停 。 

。 gen.next(): 含义 与 ge.next() 相 同 。 

。 gene.next(): 从 上 面 的 挂 起 位 置 开 始 ， 但 是 后 面 没 有 可 执行 的 了 ， 
于 是 next() 发 出 异常 。 


从 上 面 的 执行 过 程 中 会 发 现 yield 除 了 作为 生成 旨 的 标志 之 外 ， 还 有 
一 个 功能 就 是 返回 值 。 那 么 它 跟 retum 这 个 返回 值 有 什么 区 别 呢 ? 











4.9.3 yield 
为 了 型 清楚 yield 和 retum 的 区 别 ， 我 们 写 两 个 没有 什么 用 途 的 函 
数 : 


>>> def r_return(n): 
print "You taked me." 


while n > 0: 
print "before return" 
return n 
n -= 1 
print "after return" 


>>> rr = r_return(3) 
You taked me. 

before return 

>>> rr 

3 


从 函数 被 调用 的 过 程 可 以 清晰 看 出 ， 从 rr=r return 〈3) 开始 ， 就 执 
行 函 数 体内 容 了 ， 当 过 到 return 的 时 候 执 行 该 语句 ， 将 值 返回 ， 然 后 就 
结束 函数 体内 的 执行 ， 所 以 retum 后 面 的 语句 根本 没有 执行 。 


如 果 将 return 改 为 yield: 


>>> def y_yield(n): 
print "You taked me." 
while n > 0: 
print "before yield" 
yield n 
n -= 1 
print "after yield" 





>>> yy = y_ yield(3) # 没 有 执行 函数 体内 语句 

































































>>> yy.next() # 开 始 执 行 

You taked me. 

before yield 

3 # 遇 到 

yield， 返 回 值 ， 并 暂停 

>>> yy.next() # 从 上 次 暂停 位 置 开 始 继续 执行 
after yield 

before yield 

2 # 又 遇 到 


yie1d， 返 回 值 ， 并 和 暂停 





>>> yy.next() 


after yield 
before yield 
1 


>>> yy.next() 
after yield # 没 有 满足 条 件 的 值 ， 抛 出 





并 
于 


Traceback (most recent call last): 
File "<stdin>", line 1, in <module> 
StopIteration 





结合 注释 和 前 面 对 执 行 过 程 的 分 析 ， 读 者 一 定 能 理解 yield 的 特 后 
了 ， 也 深 知 与 retum 的 区 别 了 。 


一 般 的 函数 ， 都 是 止 于 return。 作 为 生成 器 的 函数 ， 由 于 有 了 
yield， 人 过 到 它 则 程序 挂 起 ， 如 果 在 之 后 还 有 retum， 过 到 它 束 直接 抛 出 
SoptIteration 异 常 而 中 止 迭 代 。 


斐 波 那 契 数列 已 经 是 老 相 识 了 ， 不 论 是 循环 还 是 友 代 都 用 它 举例 
过 ， 现 在 还 用 它 举 例 ， 只 不 过 要 用 上 yield。 





#!/UsSr/bin/env python 
# coding=utf-8 


def fibs(max): 

n, a, b = 0, 0, 1 
while n < max: 
yield b 
a, b=b,a+b 

n=n+1 


if name == "main " 
f = fibs(10) 

for i In f: 

print 工 ， 





运行 结果 如 下 : 


$ python 21501.py 
112358 13 21 34 55 


用 生成 絮 方 式 实现 的 辈 流 那 契 数列 是 不 是 跟 以 前 的 有 所 不 同 了 呢 ? 
0 
法 的 蕾 腊 。 


至 此 ， 己 经 明确 ， 一 个 函数 中 ， 只 要 包含 了 yield 语 句 ， 它 就 是 生成 





器 ， 也 是 欠 代 器 。 这 种 方式 显然 比 前 面 写 返 代 融 的 类 要 简便 多 了 ， 但 这 
Ne 
用 情景 而 定 。 





4.9.4 生成 器 方法 


在 Python2.5 以 后 ， 生 成 响 有 了 一 个 新 特征 ， 就 是 在 开始 运行 后 能 够 
为 生成 器 提供 新 的 值 。 这 就 好 似 生 成 费 和 “外 界 ” 之 间 进 行 数据 交流 。 
>>> def repeater(n): 
4 while True: 
n = (yield n) 


>>> r = repeater(4) 
>>> r.next() 


>>> r,send("hello") 
"he11o， 


当 执 行 到 rnextO 的 时 候 ， 生 成 器 开始 执行 ， 在 内 部 遇 到 了 yield n 挂 
起 。 注 意 在 生成 器 函数 中 ，n= (yieldn) 中 的 yieldn 是 一 个 表达 式 ， 并 
将 结果 赋值 给 n， 虽 然 不 严格 要 求 它 必须 用 圆 括号 包 囊 ， 但 是 一 般 情况 
都 这 么 做 ， 请 读者 也 退 随 这 个 习惯 。 


当 执 行 r.send 〈"hello") 的 时 候 ， 原 来 已 经 被 挂 起 的 生成 问 《〈 了 郴 
数 ) 又 被 唤醒 ， 开 始 执行 n= (yieldn) ， 并 将 send0) 方 法 发 送 的 值 返 
回 ， 这 就 是 在 运行 后 能 够 为 生成 器 提供 值 的 含义 。 


如 果 接 下 来 再 执行 r.next() 会 怎样 ? 














>>> r.next() 


日 
XE 


CC 


r.next()， 由 于 没有 给 函数 的 参数 传 入 任何 值 ，yield 返 回 的 就 只 外 
None. 

还 要 注意 ，send0 方 法 必须 在 生成 器 运行 后 并 挂 起 才能 使 用 ， 即 
yield 人 至 少 被 执行 一 次 。 如 果 像 下 面 一 样 就 要 报错 了 。 


>>> S = repeater(5) 
>>> s.send("how") 
Traceback (most recent call last): 
File "<stdin>", line 1, in <module> 
TypeError: can't send non-None value to a just-started generator 


承接 上 面 的 操作 ， 如 果 将 send0 的 参数 设 为 None， 束 会 把 刚才 输入 
的 数值 返回 。 


>>> s.send(None) 


此 外 ， 还 有 两 个 方法 : close0 和 throw0)。 


。throw (type，value=None，traceback=None) : 用 于 在 生成 器 内 部 
(生成 器 的 当前 挂 起 处 或 未 启动 时 在 定义 处 〉 抛 出 一 个 异常 (在 
yield 表 达 式 中 ) 。 

。 close(): 调用 时 不 用 参数 ， 用 于 关闭 生成 器 。 


本 节 最 后 一 句 : 你 在 编程 中 ， 当 然 可 以 不 用 生成 右 。 





对 于 程序 报错 己 经 看 到 过 好 多 次 了 ， 那 些 错误 都 可 以 归 类 为 “错误 
和 异 第 问题 ">。 本 半 就 要 对 程序 运行 中 出 现 的 错误 和 异常 进行 认真 研 
完 ， 近 距离 观 峙 它们 的 特点 。 








5.1 错误 


程序 员 在 编写 程序 的 时 候 ， 错 误 往 往 是 难以 避免 的 ， 可 能 是 因为 语 
法 用 错 了 ， 也 可 能 是 拼写 错 了 ， 当 然 还 可 能 有 其 他 英名 其 妙 的 错误 ， 比 
如 冒号 写成 全 角 的 了 等 。 总 之 ， 编 程 中 有 相当 一 部 分 就 是 要 不 停 地 修正 


音 误 。 











Python 中 的 常见 错误 之 一 是 语法 错误 〈syntax errors) ， 也 是 常见 的 
错误 。 比 如 : 





上 面 那 名 话 因为 缺少 冒号 “:”( 英 文 半角 ) ， 导 致 解释 器 无 法 解释 ， 
于 是 报错 。 这 个 报错 行为 是 由 Python 的 语法 分 析 器 完成 的 ， 并 且 检 测 到 
了 错误 所 在 文件 和 行 号 (File"<stdin>"，line 1) ， 还 以 向 上 箭头 “> 标识 
音 误 人 位置， 最 后 一 行 显示 错误 类 型 。 

常见 错误 之 二 是 在 没有 语法 错误 时 ， 会 出 现 逻 辑 错误 。 逻 辑 错 误 可 
能 会 由 于 不 完整 或 者 不 合法 的 输入 导致 ， 也 可 能 是 无 法 生成 、 计 算 等 ， 
或 者 是 其 他 逻辑 问题 。 


当 Python 检 测 到 一 个 错误 时 ， 解 释 需 就 无 法 继续 执行 下 去 ， 于 是 抛 
出 相应 的 信息 ， 这 些 信息 我 们 笼统 地 称 之 为 异常 信息 。 











息 


2 所 


看 一 个 异 凋 《让 0 做 分 母 了 了 ， 小 学 生 都 知道 会 有 异 帝 ) : 


>>> 1/0 
Traceback (most recent call last): 

File "<stdin>", line 1, in <module> 
ZeroDivisionError: integer division or modulo by zero 





当 Python 抛 出 异常 的 时 候 ， 痛 先 “ 跟 踊 记 录 (Traceback) ”， 还 可 以 
给 它 取 一 个 更 优雅 的 名 字 “ 回 滴 ”， 然 后 才 显 示 异 常 的 详细 信息 ， 标 明 异 
和 党 所 在 位 置 ( 文 件 、 行 或 某 个 模块 )。 最 后 一 行 是 错误 类 型 以 及 导致 异 
向 的 原因 。 


常见 的 异常 如 表 5-1 所 示 。 











NameEiror 尝试 访问 一 个 没有 申明 的 变量 
ZeroDivisionError 除数 为 0 








SyntaxError 语法 错误 





IndexError 索引 超出 序列 范围 

KeyError 请 求 一 个 不 存在 的 字典 关键 字 

IOError 输入 /输出 错误 〈 比 如 你 要 读 的 文件 不 存在 ) 
AttributeError 尝试 访问 未 知 的 对 象 属性 

















为 了 能 够 深入 理解 ， 依 次 举例 ， 展 示 蜡 和 常 的 出 现 条 件 和 结 
e NamekError 


>>> bar 

Traceback (most recent call last): 
File "<stdin>", line 1, in <module> 

NameError: name 'bar' is not defined 











Python 中 虽然 不 需要 在 使 用 变量 之 前 先 声 明 类 型 ， 但 也 需要 对 变量 
进行 赋值 ， 然 后 才能 使 用 ， 不 被 赋值 的 变量 ， 不 能 在 Python 中 存在 ， 因 








为 变量 相当 于 一 个 标签 ， 要 把 它 贴 到 对 象 上 才 有 意义 。 
e ZeroDivisionError 


>>> 1/0 
Traceback (most recent call last): 

File "<stdin>", line 1, in <module> 
ZeroDivisionError: integer division or modulo by zero 





你 或 许 有 是 够 信心 ， 貌 似 这 样 简 单 的 错误 在 你 的 编程 中 龙 不 会 出 现 
的 ， 但 在 实际 情境 中 ， 可 能 没有 这 么 容易 识别 ， 所 以 ， 依 然 要 小 心 。 





e SyntaxError 


>>> for i in range(10) 
File "<stdin>", line 1 
for i in range(10) 
八 


SyntaxError: invalid syntax 


这 种 错误 发 生 在 Python 代 码 编译 的 时 候 ， 当 编译 到 这 一 句 时 ， 解 释 
虱 不 能 将 代码 转化 为 Python 字 世人 码 就 报错 ， 它 古 在 程序 运行 之 前 出 现 
的 。 现 在 有 不 少 编辑 器 都 有 语法 校 验 功能 ， 在 你 写 代码 的 时 候 束 能 显示 
出 语法 的 正 误 ， 这 多 少 会 对 编程 者 有 和 儿 助 。 











e IndexError 


>>> a = [1, 2, 3] 

>>> a[4] 

Traceback (most recent call last): 
File "<stdin>", line 1, in <module> 

IndexError: list index out of range 


>>> d = {"python":"itdiffer.com"} 

>>> d["java"] 

Traceback (most recent call last): 
File "<stdin>", line 1, in <module> 

KeyError: 'java’ 





这 两 个 部 属于 “ 鸡 集 里 面 挑 骨头 ”类 型 ， 一 定 得 报错 了 。 不 过 在 编程 
0 
型 的 错误 。 


e [OError 


>>> f = open("foo") 
Traceback (most recent call last): 
File "<stdin>", line 1, in <module> 
IOError: [Errno 2] No such file or directory: 'foo' 


如 果 你 确认 有 文件 ， 就 一 定 要 把 路 径 写 正确 ， 因 为 你 并 没有 告诉 
Python 要 对 你 的 Computer 进 行 全 身 搜 租 。Python 只 会 按照 你 指定 的 位 置 
去 找 ， 找 不 到 就 异常 。 


e AttributeError 


>>> class A(object): pass 
>>> a = Al() 
>>> a.foo 
Traceback (most recent call last): 
File "<stdin>", line 1, in <module> 
AttributeError: 'A' object has no attribute 'foo' 


属性 不 存在 ， 出 现 错误 。 


Python 内 建 的 异常 也 不 仪 仅 是 上 面 儿 个 ， 上 面 只 是 列 出 常见 的 腊 津 
中 的 几 个 ， 还 有 : 


>>> range("aaa") 
Traceback (most recent call last): 
File "<stdin>", line 1, in <module> 
TypeError: range() integer end argument expected, got str. 





总 之 ， 如 果 读 者 在 调试 程序 的 时 候 遇 到 了 异常 ， 不 要 慨 张 ， 这 是 好 
事情 ， 是 Python 在 天助 你 修改 错误 。 只 要 认真 阅读 异常 信息 ， 再 用 
dir0、help0 或 者 官方 网 站 文档 、Google 等 来 协助 ， 一 定 能 解决 问题 。 





5.3 ”人 处理 异常 


在 一 段 程序 中 ， 为 了 能 够 让 程序 健壮 ， 有 时 还 要 处 理 异 党。 举例 : 


#!/Uusr/bin/env python 
# coding=utf-8 


while 1: 
print "this is a division program." 
c = raw_ input("input 'c' continue, otherwise logout:") 
if Cc == 'C': 
a = raw input("first number:") 
b = raw_input("second number:") 
try: 
print float(a)/float(b) 
print 几 炎 火炎 火炎 炎炎 火炎 炎炎 火炎 炎炎 火炎 炎炎 火炎 炎炎 炎炎 中 
except ZeroDivisionError: 
print "The second number can't be zero!" 
print 几 淡 火炎 淡淡 炎炎 炎炎 火炎 火炎 火炎 炎炎 火炎 火炎 火炎 炎炎 中 
else: 
break 





运行 这 段 程序 ， 显 示 如 下 过 程 : 


$ python 21601.py 

this is a division program. 

input 'c' continue, otherwise logout:c 
first number:5 

second number:2 

2.5 

类 火炎 火炎 火炎 炎炎 火炎 火炎 火炎 炎炎 火炎 炎炎 火炎 火炎 

this is a division program. 

input 'c' continue, otherwise logout:c 
first number:5 

second number:0 

The second number can't be zero! 

类 火炎 火炎 火炎 火炎 火炎 火炎 火炎 火炎 火 火 火 火 炎炎 火炎 

this is a division program. 

input 'c' continue, otherwise logout:d 


从 运行 情况 看 ， 当 在 第 二 个 数 ， 即 除数 为 0 时 ， 程 序 并 没有 因为 这 
个 错误 而 停止 ， 而 是 给 用 户 一 个 友好 的 提示 ， 让 用 户 有 机 会 改正 错误 。 
这 完全 得 益 于 程序 中 “处 理 异常 * 的 设置 ， 如 果 没 有 “处 理 异 第 "”， 则 当 并 
常 出 现时 就 会 导致 程序 中 止 。 





5.3.1 try...except... 


对 于 前 述 举例 程序 ， 只 看 try 和 except 部 分 ， 如 果 没 有 异常 发 生 ， 
except 子 句 在 try 语 句 执行 之 后 被 忽略 ;如果 try 子 句 中 有 异常 发 生 ， 该 部 
分 的 其 他 语句 被 忽略 ， 直 接 跳 到 except 部 分 ， 执 行 其 后 面 指 定 的 异常 类 
型 及 其 子 句 。 


except 后 面 也 可 以 没有 任何 异常 类 型 ， 即 无 异常 参数 。 如 果 这 样 ， 
不 论 try 部 分 发 生 什 么 异常 ， 都 会 执行 except。 


本 在 except 子 句 中 ， 可 以 根据 异常 或 者 别 的 需要 ， 进 行 更 多 的 操作 。 
站: 








#!/Uusr/bin/env python 
# coding=utf-8 


class Calculator(object ) : 
is_raise = False 
def calc(self, express): 
try: 
return eval(express) 
except ZeroDivisionError: 
if self.is raise: 
print "zero can not be division." 
else: 
raise 


先 解释 函数 eval0， 它 的 含义 是 : 


eval(...) 
eval(source[, globals[, locals]]) -> value 


Evaluate the source in the context of globals and locals. 

The source may be a string representing a Python expression 

or a code object as returned by compile(). 

The globals must be a dictionary and locals can be any mapping, 
defaulting to the current globals and locals. 

If only globals is given, locals defaults to it. 


例如 : 


>>> eval("3+5") 
8 


男 外 ， 在 except 子 句 中 ， 还 有 一 个 孤零零 的 raise， 作 为 单独 一 个 语 





句 ， 它 的 含义 是 将 异常 信 息 抛 出 ， 并 且 except 子 句 用 了 一 个 判断 语句 ， 
根据 不 同 的 情况 确定 走 不 同 的 分 文 。 


if name == ”main ": 
c = Calculator() 
print c.calc("8/0") 





故意 出 现 0 做 分 母 的 情况 ， 就 是 要 让 is_raise=False， 则 会 : 


$ python 21602 .py 
Traceback (most recent call last): 
File "21602.py", line 17, in <module> 
print c.calc("8/0") 
File "21602.py", line 8, in calc 
return eval(express) 
File "<string>", line 1, in <module> 
ZeroDivisionError: integer division or modulo by zero 


如 果 将 is_raise 的 值 改 为 True， 会 是 这 样 : 


if name == "_ main _": 
c = Calculator() 
c.is _ raise = True 
print c.calc("8/0") 





运行 结果 : 


$ python 21602.py 
zero can not be division. 
None 


最 后 的 None 是 c.calc ("8/0") 的 返回 值 ， 因 为 有 print 
c.calc ("8/0") ， 所 以 被 打印 出 来 。 


5.3.2 ”处 理 多 个 异常 


处 理 多 个 异 常 并 不 是 因为 同时 报 出 多 个 异常 ， 程 序 在 运行 中 ， 只 要 
过 到 一 个 异常 就 会 有 有 反应， 所以， 每 次 捕获 到 的 异常 一 定 是 一 个 。 所 请 
处 理 多 个 异 常 的 意思 是 可 以 容许 捕获 不 同 的 异 和 常 ， 由 不 同 的 except 子 句 
处 理 。 








#!/UsSr/bin/env python 


# Coding=utf-8 


while 1: 
print "this is a division program." 
c = raw_input("input 'c' continue, otherwise logout:") 
if “Ce = "Ce!: 
a = raw input("first number:") 
b = raw_input("second number:") 
try: 
print float(a)/float(b) 
print 几 炎 火炎 炎炎 炎炎 炎炎 火炎 火炎 炎炎 炎炎 炎炎 火炎 火炎 炎炎 咱 
except ZeroDivisionError: 
print "The second number can't be zero!" 
print 几 炎 火炎 炎炎 炎炎 炎炎 火炎 火炎 炎炎 炎炎 炎炎 火炎 火炎 炎炎 中 
except ValueError: 
print "please input number." 
print 几 炎 火炎 炎炎 炎炎 炎炎 火炎 炎炎 炎炎 火炎 火炎 炎炎 炎炎 类 叫 
else: 
break 





修改 一 下 程序 ， 增 加 了 一 个 except 子 句 ， 目 的 是 当 用 户 输 入 的 不 是 
数字 时 ， 捕 获 并 处 理 这 个 异常 。 测 试 如 下 : 


$ python 21701.py 

this is a division program. 

input 'c' continue, otherwise logout:c 
first number:3 

second number:"hello" # 输 入 了 一 个 不 是 数字 的 东西 




















please input number. # 对 照 上 面 的 程序 ， 捕 获 并 处 理 了 这 个 异常 














类 炎炎 火炎 火炎 炎炎 火炎 火炎 炎炎 炎炎 火炎 火炎 类 火炎 

this is a division program. 

input 'c' continue, otherwise logout:c 
first number:4 

second number:0 


The second number can't be zero! 
类 炎炎 炎炎 炎炎 炎炎 类 类 类 类 炎炎 炎炎 炎炎 炎炎 炎炎 类 类 


this is a division program. 
input 'c' continue, otherwise logout:4 


如 果 有 多 个 except，try 里 面 过 到 一 个 异常 ， 就 转 到 相应 的 except 子 
句 ， 其 他 的 忽略 。 如 果 except 没 有 相应 的 异常 ， 访 异常 也 会 扫 出 ， 不 过 
这 时 程序 就 要 中 止 了 ， 因 为 异常 “ 浮 出 ?程序 顶部 。 


除了 用 多 个 except 之 外 ， 还 可 以 在 一 个 except 后 面 放 多 个 异常 参 
数 ， 比 如 上 面 的 程序 ， 可 以 将 except 部 分 修改 为 : 





except (ZeroDivisionError, ValueError): 


print "please input rightly." 


] 几 淡 炎炎 炎炎 火炎 火炎 火炎 火炎 炎炎 炎炎 炎炎 火电 
print 


运行 的 结果 就 是 : 


$ python 21701.py 

this is a division program. 

input 'c' continue, otherwise logout:c 
first number:2 

second number:0 # 捕 获 异常 




















please input rightly. 

类 火炎 火炎 火炎 炎炎 火炎 火炎 炎 火 炎炎 火炎 类 

this is a division program. 

input 'c' continue, otherwise logout:c 
first number:3 

second number:a # 异 常 


please input rightly. 

类 火炎 火炎 火炎 炎炎 火炎 炎炎 炎炎 类 火 火 火炎 

this is a division program. 

input 'c' continue, otherwise logout:d 





需要 注意 的 是 ，except 后 面 如 果 是 多 个 参数 ， 一 定 要 用 圆 括号 包 囊 
不 








在 对 异常 的 处 理 中 ， 前 面 都 是 自己 写 一 个 提示 语 ， 但 自己 写 的 不 如 
内 置 的 异常 错误 提示 好 ， 如 果 希 望 把 默认 错误 提示 打印 出 来 ， 但 程序 还 
不 能 中 断 ， 怎 么 办 ? Python 提供 了 一 种 方式 ， 将 上 面 的 代码 修改 如 下 : 











while 1: 
print "this is a division program." 
c = raw_input("input 'c' continue, otherwise logout:") 
if Cc == 'C': 
a = raw input("first number:") 
b = raw_input("second number:") 
try: 
print float(a)/float(b) 
print 几 炎 火炎 炎炎 炎炎 炎炎 火炎 火炎 炎炎 炎炎 火炎 火炎 炎炎 炎炎 咱 
except (ZeroDivisionError, ValueError), e: 
print e 
print 几 炎 火炎 炎炎 炎炎 炎炎 火炎 火炎 炎炎 炎炎 炎炎 火电 
else: 
break 








运行 一 下 ? 看 看 提示 信息 O 


$ python 21702 .py 

this is a division program. 

input 'c' continue, otherwise logout:c 
first number:2 

second number:a # 异 


于 


could not convert string to float: a 

炎炎 火炎 炎炎 火炎 火炎 火炎 火炎 火炎 火炎 火炎 

this is a division program. 

input 'c' continue, otherwise logout:c 
first number:2 

second number:0 # 异 


float division by zero 


炎炎 火炎 炎炎 火炎 火炎 火炎 火炎 火炎 火 火 火炎 
this is a division program. 
input 'c' continue, otherwise logout:d 


在 Python 3.x 中 ， 常 党 这 样 写 : except (ZeroDivisionError， 
ValueError) as e: 


ii 只 处 理 了 两 个 异常 ， 还 可 能 有 更 多 的 异常 ， 如 果 
要 人 处理， 怎么 办 ? 可 以 这 文 样 : execpt: 或 者 except Exception，e， 2 面 什 
么 参数 也 不 写 就 好 了 。 





5.3.3 ”else 子 句 


有 了 try.…except...， 在 一 般 情况 下 是 够 用 的 ， 但 总 有 不 一 般 的 时 候 
出 现 ， 所 以 ， 束 增 加 了 一 个 else 子 句 。 其 实 ， 人 类 的 自然 语言 何尝 不 是 
如 此 呢 ? 总 要 根据 需要 添加 不 少 东西 。 














>>> try: 

Rs print "I am try" 
, except: 

es print "I am except" 
, else: 


print "I am else" 


I am try 
I am else 


这 段 演 示 能 够 帮助 读者 理解 else 的 执行 特点 。 如 果 执 行 了 try， 则 


except 被 忽略 ， 但 是 else 被 执行 。 


>>> try: 
2 print 1/0 
. except: 
Ne print "I am except" 
, else: 
print "I am else" 


I a except 

这 时 候 else 就 不 被 执行 了 。 

理解 了 else 的 执行 特点 ， 可 以 写 这 样 一 段 程序 ， 还 是 类 似 于 前 面 的 
计算 ， 只 是 如 果 输 入 的 有 误 ， 就 不 断 要 求 重 新 输入 ， 直 到 输入 正确 并 得 
到 了 结果 ， 才 不 再 要 求 输入 内 容 ， 然 后 程序 结束 。 


在 看 下 面 的 参考 代码 之 前 ， 读 者 是 人 否 可 以 先 上 自己 写 一 段 并 调试 ? 看 
看 结果 如 何 。 





#!/UsSr/bin/env python 
# Coding=utf-8 
while 1: 
try: 
x 
y 


= raw_input("the first number:") 
= raw_input("the second number:") 
r = float(x)/float(y) 
print r 
except Exception, e: 
print e 
print "try again." 
else: 
break 


先 看 运行 结果 : 


$ python 21703.py 
the first number:2 


the second number:0 # 异 常 ， 执 行 
except 

float division by zero 

try again. # 循 环 


the first number :2 
the second number :a # 异 常 


could not convert string to float: a 
try again. 

the first number:4 

the second number:2 # 正 常 ， 执 行 





try 
2.0 # 然 后 


else: 





break， 退 出 程序 


相当 满意 的 执行 结 


程序 中 的 “except Exception，e” 的 含义 是 不 管 什么 异常 ， 这 里 都 会 
捕获 ， 并 且 传 给 变量 e， 然 后 用 print e 把 异常 信息 打印 出 来 。 





5.3.4 finally 子 名 








finally 子 句 ， 一 听 这 个 名 字 ， 就 感觉 它 是 做 善后 工作 的 。 的 确 如 
此 ， 如 果 有 了 finally， 不 管 前 面 执 行 的 是 ty， 还 是 except， 最 终 都 要 执 
行 它 。 因 此 有 一 种 说 法 是 将 finally 用 在 可 能 的 异常 后 进行 清理 。 比 如 : 


>>> x = 10 


>>> try: 
ee x = 1/0 
. except Exception, e: 
print e 
. finally: 
print "del x" 
del x 


integer division or modulo by zero 
del x 


看 一 看 x 是 人 否 被 删除? 








>>> x 


Traceback (most recent call last): 


File "<stdin>", line 1, in <module> 
NameError: name 'x' is not defined 


wm 在 应 用 中 可 以 将 上 面 的 各 个 子 句 都 综合 起 来 使 用 ， 写 成 如 下 
工 N 3: 


try: 

do something 
except: 

do something 
else: 

do something 
finally 

do something 





看 到 这 里 ， 你 是 不 是 觉得 这 个 “try...except...” 跟 “if...else...” 有 点 相 
0 但 不 要 误 以 为 某 一 个 就 可 以 取代 另外 一 个 ， 他 们 的 存在 都 是 有 道 
理 的 。 





5.3.5 ” assert 语句 


>>> assert 1==1 

>>> assert 1==0 

Traceback (most recent call last): 
File "<stdin>", line 1, in <module> 

AssertionError 


从 上 面 的 举例 中 可 以 基本 了 解 assert 的 特点 。 


assert， 翻 译 过 来 是 “断言 > 之 意 。assert 是 语句 等 价 于 布尔 真 的 判 


定 ， 发 生 异 常 就 意味 着 表达 式 为 假 。 


assert 的 应 用 情景 与 其 翻译 的 意思 “断言 一样 ， 即 当 程 序 运行 到 某 个 
节点 的 时 候 ， 就 断定 某 个 变量 的 值 必然 是 什么 ， 或 者 对 象 必 然 拥 有 某 个 
属性 等 ， 简 单 说 就 是 断定 什么 东西 必然 是 什么 ， 如 果 不 是 ， 就 抛 出 错 


误 。 


























#!/UsSr/bin/env python 
# coding=utf-8 


class Account(object ) : 
def _ init (self, number): 
self.number = number 


的 ， 


self.balance = 0 


de 


+h 


deposit(self, amount): 
assert amount > 0 
self.balance += balance 


de 


下 


withdraw(self, amount): 

assert amount > 0 

If amount <= self.balance: 
self.balance -= amount 

else: 
print "balance is not enough." 


程序 中 ，deposit() 和 withdraw() 方 法 的 参数 amount 值 必须 是 大 于 零 
这 里 就 用 断言 ， 如 果 不 满足 条 件 束 会 报错 。 比 如 这 样 来 运行 : 


if name == "_ main 





a = Account(1000 ) 
a.deposit(-10) 


出 现 的 结果 是 : 


$ python 21801.py 
Traceback (most recent call last): 


File "21801.py", line 22, in <module> 
a.deposit(-10) 

File "21801.py", line 10, in deposit 
assert amount > 0 


AssertionError 


这 就 是 断言 assert 的 作用 。 什 么 是 使 用 断言 的 最 佳 时 机 ? 


如 末 没 有 特别 的 目的 ， 断 言 应 该 用 于 如 下 情况 : 
防御 性 的 编程 。 

运行 时 对 程序 逻辑 的 检测 。 

合约 性 检查 《比如 前 置 条 件 ， 后 置 条 件 ) 。 
程序 中 的 和 常量。 

检查 文档 。 


(上 述 要 后 来 自 《Python 使 用 断言 的 最 佳 时 机 》 网 址 : 











http://www.oschina.net/translate/when-to-use-assert ) 





不 论 是 否 理解 ， 都 要 先 看 看 ， 请 牢记 ， 在 具体 的 开发 过 程 中 ， 有 时 








间 束 看 看 本 书 ， 不 靳 加 深 对 这 些 概念 的 理解 ， 这 也 是 master 的 成 就 之 


2 


最 后 ， 引 用 危机 百科 中 对 “异常 处 理 ” 词 条 的 说 明 ， 作 为 对 “错误 和 
异常 ”部 分 的 总 结 《有 所 删改 〉: 


异 币 处 理 是 编程 语言 或 计算 机 硬件 里 的 一 种 机 制 ， 用 于 处 理 软件 或 
电 系 统 中 出 现 的 异 币 状 况 《〈 即 超出 程序 正 币 执 行 流 程 的 菜 些 特殊 条 
让 入 


各 种 编程 语言 在 处 理 异 常 方 面具 有 非常 显 蔷 的 不 同 点 (错误 检测 与 
异常 处 理 的 区 别 在 于 : 错误 检测 是 在 正常 的 程序 流 中 ， 处 理 不 可 预见 问 
题 的 代码 ， 例 如 一 个 调用 操作 未 能 成 功 结束 ) 。 某 些 编程 语言 有 这 样 的 
函数 : 当 输 入 存在 非法 数据 时 不 能 被 安全 地 调用 ， 或 者 返回 值 不 能 与 异 
常 进行 有 效 的 区 别 。 例 如 ，C 语 言 中 的 atoi 函 数 〈( 从 ASCII 串 到 整数 的 转 
换 ) 在 输入 非法 时 可 以 返回 0。 在 这 种 情况 下 编程 者 需要 另外 进行 错误 
检测 〈 可 能 通过 某 些 辅助 全 局 变量 ， 如 C 的 errmno) ， 或 进行 输入 检验 
(如 通过 正则 表达 式 ) ， 或 者 共同 使 用 这 两 种 方法 。 


通过 异常 处 理 ， 我 们 可 以 对 用 户 在 程序 中 的 非法 输入 进行 控制 和 提 
示 ， 以 防 程序 朋 尝 。 


从 进程 的 视角 来 看 ， 便 件 中 断 相当 于 可 恢复 异常 ， 虽 然 中 断 一 般 与 
程序 流 本 里 无 关 。 


从 子 程 友 编 程 者 的 视角 来 看 ， 寞 党 是 很 有 用 的 一 种 机 制 ， 用 于 通知 
外 界 该 子 程序 不 能 正 第 执行 ， 如 输入 的 数据 无 效 〈 例 如 除数 是 0〉 ， 或 
所 需 资 源 不 可 用 例如 文件 丢失 ) 。 如 果 系 统 没 有 异常 机 制 ， 则 编程 者 
让 要 用 返回 值 来 标示 发 生 了 哪些 错误 。 


Python 语言 对 寞 第 处 理 机 制 是 非常 普遍 深入 的 ， 所 以 想 写 出 不 合 
try、except 的 程序 非常 困难 。 























第 6 章 ”模块 


随 着 对 Python 学 习 的 深入 ， 其 优点 日 渐 突 出 ， 让 读者 也 感觉 到 
Python 的 强大 了 ， 强 大 感觉 之 一 就 是 “模块 自信”， 因 为 Python 不 仅 有 上 自 
带 的 模块 《〈 称 之 为 标准 库 ) ， 还 有 海量 的 第 三 方 模块 ， 并 且 很 多 开发 者 
还 在 不 断 贡 献上 和 目 己 开 发 的 新 模块 ， 正 是 有 了 这 么 强大 的 “模块 目 信 ?”， 
Python 才 被 很 多 人 钟爱 。 并 且 这 种 方式 也 正在 不 断 被 其 他 更 多 语言 所 借 
鉴 ， 几 乎 成 为 普 世 行为 了 《不 知道 Python 是 不 是 首倡 者 ) 。 


“模块 自信 ”的 本 质 是 : 开放 。 


Python 不 是 一 个 封闭 的 体系 ， 而 是 一 个 开放 系统 。 开 放 系 统 的 最 大 
好 处 就 是 避免 了 ， 炳 增 ”。 


烂 的 概念 是 由 德国 物理 学 家 克 劳 修 斯 于 1865 年 所 提出 ， 是 一 种 测量 
在 动力 学 方面 不 能 做 功 的 能 量 总 数 ， 也 就 是 当 总 体 的 糯 增 加 ， 其 做 功能 
力也 下 降 ， 焙 的 量度 正 是 能 量 退 化 的 指标 。 


炉 亦 被 用 于 计算 一 个 系统 中 的 失 序 现象 ， 也 就 是 计算 该 系统 混乱 的 
王 硫 。 


根据 烂 的 统计 学 定义 ， 热 力学 第 二 定律 说 明 一 个 孤立 系统 倾向 于 增 
加 混乱 程度 。 换 句 话 说 就 是 对 于 封闭 系统 而 言 ， 会 越 来 越 趋同 于 无 序 
化 。 反 过 来 ， 开 放 系 统 则 能 避免 无 序 化 。 














6.1 编写 模块 


想必 读者 已 经 熟悉 了 import 语 句 ， 曾 经 有 这 样 一 个 例子 : 


>>> import math 
>>> math .pow(3,2) 
9.0 


这 里 的 math 〈 是 Python 标准 库 之 一 ， 在 本 章 ， 我 们 要 逐渐 理解 模 
块 、 库 之 类 的 术语 。) 就 是 一 个 模块 ， 用 import 引 入 这 个 模块 ， 然 后 可 
以 使 用 模块 里 面 的 函数 ， 比 如 pow0 函 数 。 显 然 ， 这 里 是 不 需要 自己 动 
手写 具体 疯 数 的 ， 我 们 的 任务 束 是 拿 过 来 使 用 。 这 就 是 模块 的 好 人 处， 拿 
过 来 就 用 ， 不 用 目 己 重 写 。 








6.1.1 模块 是 程序 


“模块 是 程序 "一 语 道破 了 模块 的 本 质 ， 它 就 是 一 个 扩展 名 为 .py 的 
Python 程序 。 


我 们 能 够 在 应 该 使 用 它 的 时 候 将 它 引用 过 来 ， 节 省 精力 ， 不 需要 重 
写 雷同 的 代码 。 


但 是 ， 如 宋 我 目 己 写 一 个 .py 文件 ， 是 不 是 就 能 作为 模块 import 过 来 
呢 ? 还 不 那么 简单 。 必 须 得 让 Python 解释 器 能 够 找到 你 写 的 模块 。 比 
如 ， 在 某 个 目录 中 ， 我 写 了 这 样 一 个 文件 : 


#!/UsSr/bin/env python 
# coding=utf-8 
lang = "python" 


并 把 它 命名 为 pm.py， 那 么 这 个 文件 就 可 以 作为 一 个 模块 被 引入 。 
不 过 由 于 这 个 模块 是 我 自己 写 的 ，Python 解 释 器 并 不 知道 ， 得 先 告诉 它 
我 写 了 这 样 一 个 文件 。 





>>> import sys 
>>> sys.path.append("~/Documents/VBS/StartLearningPython/2code/pm.py") 


用 这 种 方式 告诉 Python 解释 器 ， 我 写 的 那个 文件 在 哪里 。 在 这 个 方 
法 中 ， 也 用 了 模块 inport sys， 不 过 由 于 sys 是 Python 标准 库 之 一 ， 所 以 
不 用 特别 告诉 Python 解释 器 其 位 置 。 


上 面 那 个 一 长 串 的 地 址 是 Ubuntu 系统 的 地 址 格式 ， 如 果 读 者 使 用 的 
是 Windows 系 统 ， 请 写 你 所 保存 的 文件 路 径 。 


>>> import pm 
>>> pm.1lang 
'python' 


在 pm.py 文 件 中 有 一 个 赋值 语句 ， 即 lang="python"， 现 在 将 pm.py 作 
为 模块 引入 注意 作为 模块 引入 的 时 候 不 带 扩 展 名 )〉 ， 就 可 以 通过 “ 模 
块 名 字 ”+“.”+“ 属 性 或 方法 名 称 ” 来 访问 pm.py 中 的 东西 。 当 然 ， 如 有 果 要 访 
问 不 存在 的 属性 ， 肯 定 是 要 报错 的 。 








>>> pm.xx 
Traceback (most recent call last): 
File "<stdin>", line 1, in <module> 
AttributeError: 'module' object has no attribute 'xx' 











请 读者 回 到 pm.py 文 件 的 存储 目录 ， 查 看 一 下 是 不 是 多 了 一 个 扩展 
名 是 .pyc 的 文件 ? 


解释 器 ， 责 文 是 : interpreter， 在 Python 中 ， 它 的 作用 就 是 将 .py 的 
文件 转化 为 .pyc 文 件 ， 而 .pyc 文 件 是 由 字 疗 码 (bytecode) 构成 的 ， 然 后 
计算 机 执行 .pyc 文 件 。 


很 多 人 喜欢 将 这 个 世界 简化 再 简化 ， 比 如 编程 语言 就 分 为 解释 型 和 
编译 型 ， 不 但 如 此 ， 还 将 两 种 类 型 的 语言 分 别 贴 上 运行 效率 高 低 的 标 
签 ， 解 释 型 的 运行 速度 就 慢 ， 编 译 型 的 运行 速度 就 快 。 一 般 人 都 把 
Python 看 成 是 解释 型 的 ， 于 是 就 得 出 它 运 行 速度 慢 的 结论 。 不 少 人 都 因 
此 上 当 受 骗 了 ， 认 为 Python 不 值得 学 ， 或 者 做 不 了 什么 “大 事 ”。 这 就 是 
将 本 来 复杂 的 、 多 样 化 的 世界 非得 划分 为 “黑白 ”的 结果 ， 喜 欢 用 * 非 此 
即 彼 ” 的 思维 方式 考虑 问题 。 


世界 是 复杂 的 ,，“ 敌 人 的 敌人 就 是 朋友 ”是 幼稚 的 ，“ 一 分 为 二 ”是 机 











械 的 。 


如 同 刚才 看 到 的 那个 .pyc 文 件 一 样 ， 当 Python 解释 需 读 取 了 .py 文 
1 先 将 它 变 成 由 字 厂 得 组 成 的 ,pyc 文 件 ， 然后 这 个 .pyc 文 件 交 给 一 个 
叫 作 Python 虚拟 机 的 东西 去 运行 〈 那 些 号 称 编译 型 的 语言 也 是 这 个 流 
程 ， 不 同 的 是 它们 先 有 一 个 明显 的 编译 过 程 ， 编 详 好 了 之 后 再 运行 )。 
如 果 .py 文 件 修 改 了 ，Python 解 释 占 会 重新 编译 ， 只 是 这 个 编译 过 程 不 全 
显示 给 你 看 。 


有 了 .pyc 文 件 后 ， 每 次 运行 束 不 需要 重新 让 解释 器 来 编译 .py 文件 
J .py 文件 修改 了 。 这 样 ，Python 运 行 的 就 是 那个 编译 好 了 的 .pyc 
文件 。 

















是 否 还 记得 前 面 : 号 有 大 程序 然后 执行 时 向 常 要 用 到 
ff _name ==" main "， 那 时 我 们 直接 用 “python filename.py” 的 格式 
来 运行 该 文件 ， 此 时 我 们 也 同样 有 了 .py 文件 ， 不 过 是 作为 模块 引入 
的 。 这 就 得 深入 探究 一 下 ， 同 样 是 .py 文件 ， 它 怎么 知道 是 被 当 作 程序 
执行 还 是 被 当 作 模 块 引入 ? 


为 了 便于 比较 ， 将 pm.py 文 件 进 行 改造 。 








#!/UsSr/bin/env python 
# coding=utf-8 


def lang(): 
return "python" 


if name == "main " 
print lang() 





沿用 先前 的 做 法 : 


$ python pm.py 
python 


如 宁 将 这 个 程序 作为 模块 ， 导 入 ， 会 是 这 样 的 : 


>>> import sys 

>>> sys.path.append("~/Documents/VBS/StarterLearningPython/2code/pm.py") 
>>> import pm 

>>> pm.1lang() 

'python' 


查看 模块 属性 和 方法 ， 可 以 使 用 dir()。 


>>> dir(pm) 
['_ builtins ', '_doc ', '_file ', '_ name ', ' package ', 'lang'] 





人 可 以 把 它 当 作 程序 来 执行 ， 也 可 以 将 它 作 为 模 
As 


>>> _name _ 
"main _' 

>>> pm. name _ 
"pm' 


如 果 要 作为 程序 执行 ， 则 _name ” ==" main “"; 如 果 作 为 模块 引 
入 ， 则 pm._name =="pm"， 即 变量 _name_ 的 值 是 模块 名 称 。 

用 这 种 方式 就 可 以 区 分 是 执行 程序 还 是 作为 模块 引入 了 。 

在 一 般 情 况 下 ， 如 果 仅 仪 是 用 作 模 块 引 入 ， 不 必 写 


TT 


if name ==" main "。 








6.1.2 ”模块 的 位 置 


为 了 让 我 们 自己 写 的 模块 能 够 被 Python 解释 器 知道 ， 需 要 用 
sys.path.append ("~/Documents/VBS/StarterLeamingPython/2code/pm.py") 
其 实 ， 在 Python 中 ， 所 有 模块 都 被 加 入 到 了 sys.path 里 面 。 用 下 面 的 方法 
可 以 看 到 模块 所 在 位 置 : 


>>> import sys 

>>> import pprint 

>>> pprint.pprint(sys.path) 
['', 
'/usr/local/lib/python2.7/dist-packages/autopep8-1.1-py2.7.egg', 
'/usr/local/lib/python2.7/dist-packages/pep8-1.5.7-py2.7.egg', 
'/usr/lib/python2.7', 

'/usr/lib/python2.7/plat-i386-]inux-gnu', 
'/usr/lib/python2.7/1ib-tk', 

'/usr/lib/python2.7/1ib-old', 

'/usr/lib/python2.7/1l1ib-dynload', 
'/usr/local/lib/python2.7/dist-packages', 
'/usr/lib/python2.7/dist-packages', 
'/usr/lib/python2.7/dist-packages/PILcompat', 
'/usr/lib/python2.7/dist-packages/gtk-2.0', 


'/usr/lib/python2.7/dist-packages/ubuntu-sso-client', 
'~/Documents/VBS/StarterLearningPython/2code/pm.py'] 


从 中 也 发 现 了 我 自己 写 的 那个 文件 。 


凡 在 上 面 列 表 所 包括 位 置 内 的 .py 文件 都 可 以 作为 模块 引入 。 不 妨 
举 个 例子 ， 把 前 面 自己 编写 的 pm.py 文 件 修改 为 pmlib.py， 然 后 复制 
到 J'/usr/lib/python2.7/dist-packages 中 。 (这 是 以 Ubuntu 为 例 说 明 ， 如 果 是 
其 他 操作 系统 ， 读 者 用 类 似 方 法 也 能 找到 。) 


$ sudo cp pm.py /usr/lib/python2.7/dist-packages/pmlib.py 
[sudo] password for qw: 


$ ls /usr/lib/python2.7/dist-packages/pm* 
/usr/lib/python2.7/dist-packages/pmlib.py 


文件 放 到 了 指定 位 置 。 看 下 面 的 : 





>>> import pmlib 

>>> pmlib.lang 

<function lang at Oxb744372c> 
>>> pmlib.1lang() 

'python' 


将 模块 文件 放 到 指定 位 置 是 一 种 不 错 的 方法 ， 但 感觉 此 法 受到 了 拘 
束 ， 程 序 员 都 喜欢 目 由 ， 能 不 能 放 到 别处 呢 ? 


当然 能 ， 用 sys.path.append0 就 是 不 管 把 文件 放 在 哪里 ， 都 可 以 把 其 
位 置 告诉 Python 解释 器 。 虽 然 这 种 方法 在 前 面 用 了 ， 但 其 实 是 很 不 常用 
的 ， 因 为 它 也 有 麻烦 的 地 方 ， 比 如 在 交互 模式 下 ， 如 果 关 闭 了 ， 再 开 
启 ， 还 得 重新 告知 。 


比较 常用 的 方法 是 设置 PYTHONPATH 环 境 变 量 。 


环境 变量 ， 不 同 的 操作 系统 设置 方法 略 有 差异 。 读 者 可 以 根据 上 自己 
的 操作 系统 ， 到 网 上 搜索 设置 方法 。 


以 Ubuntu 为 例 ， 建 立 一 个 Python 的 目录 ， 然 后 将 我 自己 写 的 .py 文件 
放 到 这 里 ， 并 设置 环境 变量 。 

















:~$ mkdir python 
:~$ cd python 
:~/python$ cp ~/Documents/VBS/StarterLearningPython/2code/pm.py mypm.py 


:~/python$ 1s 
mypm.py 


然后 将 这 个 目录 ~/python， 即 /home/qw/python 设 置 环境 变量 。 


vim /etc/profile 


要 用 root 权 限 ， 在 打开 的 文件 最 后 增加 export 
PATH=/home/qw/python:$PAT， 然 后 保存 退出 即 可 。 


注意 ， 我 是 在 ~/python 目 录 下 输入 Python， 然 后 进入 到 交互 模式 : 
:~$ cd python 


:~/python$ python 


>>> import mypm 
>>> mypm.1lang() 
'python' 


如 此 ， 束 完成 了 告知 过 程 。 


6.1.3 _ all_ 在 模块 中 的 作用 














上 面 的 模块 虽然 比较 简单 ， 但 是 已 经 显示 了 编写 模块 ， 以 及 在 程序 
中 导入 模块 的 基本 方式 。 在 实践 中 ， 所 编写 的 模块 也 许 更 复杂 一 点 ， 比 
如 ， 有 这 么 一 个 模块 ， 其 文件 命名 为 pp.py 
# /Usr/bin/env python 
# coding:utf-8 


public_variable = "Hello, I am a public variable." 
_private_ variable = "Hi, I am a private variable." 


def public_teacher(): 
print "I am a public teacher, I am from JP." 


def _private_ teacher(): 
print "I am a private teacher, I am from CN." 


接 下 来 就 是 熟悉 的 操作 了 ， 进 入 到 交互 模式 中 。pp.py 这 个 文件 就 
是 一 个 模块 ， 该 模块 中 包含 了 变量 和 函数 。 


>>> import sys 


>>> sys.path.append("~/Documents/StarterLearningPython/2code/pp.py") 
>>> import pp 
>>> from pp import * 
>>> public_variable 
'Hello, I am a public variable.' 
>>> _private_variable 
Traceback (most recent call last): 
File "<stdin>", line 1, in <module> 
NameError: name '_private variable' is not defined 


变量 public_variable 能 够 被 使 用 ， 但 是 另外 一 个 变量 
_private_variable 不 能 被 调用 ， 先 观察 一 下 两 者 的 区 别 ， 后 者 是 以 单 下 男 
线 开 头 的 ， 这 样 的 是 私有 变量 。 而 from pp import* 的 含义 是 “希望 能 访问 
模块 (pp〉 中 有 权限 访问 的 全 部 名 称 ”， 那 些 被 视 为 私有 的 变量 或 者 函 
数 或 者 类 ， 当 然 束 没有 权限 被 访问 了 。 


再 如 : 





>>> public_teacher() 
I am a public teacher, I am from JP. 
>>> _private_teacher() 
Traceback (most recent call last): 
File "<stdin>", line 1, in <module> 
NameError: name '_private teacher' is not defined 


这 不 是 绝对 的 ， 但 如 果 要 访问 具有 私有 性 质 的 东西 ， 可 以 这 样 做 。 


>>> import pp 

>>> pp._private_teacher() 

I am a private teacher, I am from CN. 
>>> pp._private_variable 

'Hi, I am a private variable.' 


下 面 再 对 pp.py 文 件 进行 改写 ， 增 加 一 些 东 西 。 


# /usr/bin/env python 
# coding:utf-8 


_all = ['_private variable', 'public_ teacher'] 
public_variable = "Hello, I am a public variable." 
_private _ variable = "Hi, I am a private variable." 


def public_teacher(): 
print "I am a public teacher, I am from JP." 


def _private_ teacher(): 
print "I am a private teacher, I am from CN." 


在 修改 之 后 的 pp.py 中 ， 增 加 了 _ all_ 变量 以 及 相应 的 值 ， 在 列表 
中 包含 了 一 个 私有 变量 的 名 字 和 一 个 函数 的 名 字 。 这 是 在 告诉 引用 本 模 
块 的 解释 器 ， 这 两 个 东西 是 有 权限 被 访问 的 ， 而 且 只 有 这 两 个 东西 。 








>>> import sys 

>>> sys.path.append("~/Documents/StarterLearningPython/2code/pp.py") 
>>> from pp import * 

>>> _private_variable 

'Hi, I am a private variable.' 


果然 ， 曾 经 不 能 被 访问 的 私有 变量 ， 现 在 能 够 访问 了 。 


>>> public_variable 
Traceback (most recent call last): 
File "<stdin>", line 1, in <module> 
NameError: name 'public variable' is not defined 


因为 这 个 变量 没有 在 _all_ 的 值 中 ， 虽 然 以 前 曾经 被 访问 到 过 ， 但 
古 现 在 就 不 行 了 。 


>>> public_teacher() 
I am a public teacher, I am from JP. 
>>> _private_teacher() 
Traceback (most recent call last): 
File "<stdin>", line 1, in <module> 
NameError: name '_private teacher' is not defined 








这 只 不 过 是 再 次 说 明 前 面 的 结论 罢了 。 当 然 ， 如 果 以 import pp 引入 
模块 ， 再 用 pp._private_teacher 的 方式 是 一 样 有 效 的 。 


6.1.4 包 和 库 





顾名思义 ， 包 和 库 都 是 比 “ 模 块 * 大 的 。 一 般 来 讲 ， 一 个 “ 包 ” 里 面 会 
有 多 个 模块 ， 当 然 ,“ 库 ?是 一 个 更 大 的 概念 了 ， 比 如 Python 标准 库 中 的 
每 个 库 都 有 好 多 个 包 ， 每 个 包 都 有 大 干 个 模块 。 


一 个 包 由 多 个 模块 组 成 ， 即 有 多 个 .py 的 文件 ， 那 么 这 个 所 谓 
的 “ 包 ” 束 是 我 们 熟悉 的 一 个 目录 回 了。 现在 需要 解决 如 何 引 用 茶 个 目录 
中 的 模块 问题 。 解 决 方法 就 是 在 该 目录 中 放 一 个 _init .py 文件 。 
_ init .py 是 一 个 空 文件 ， 将 它 放 在 茶 个 目录 中 ， 就 可 以 将 该 目录 中 的 

















其 他 .py 文件 作为 模块 被 引用 。 


例如 ， 建 立 一 个 目录 ， 名 日 : package_qi， 里 面 依次 放 了 pm.py 和 
pp.py 两 个 文件 ， 然 后 建立 一 个 空 文件 _init_.py 


接 下 来 ， 需 要 导入 这 个 包 (package_qi) 中 的 模块 。 
下 面 这 种 方法 很 清晰 明了 。 


>>> import package_qi.pm 
>>> package_qi.pm.1lang() 
'python' 


下 面 这 种 方法 ， 貌 似 简 短 ， 但 如 果 多 了 ， 榴 怕 难 以 分 辨 。 


>>> from package_qi import pm 
>>> pm.1lang() 
'python' 





在 后 续 制 作 网 站 的 实战 中 ， 还 会 经 常用 到 这 种 方式 ， 届 时 会 了 解 更 
多 。 请 保持 兴趣 继续 阅读 ， 不 要 半途 而 废 ， 不 然 颖 惑 得 不 到 解决 ， 好 东 
西 就 看 不 到 了 。 








6.2 目 市 电池 


“Python 自 带 ‘ 电 池 ”， 昕 说 过 这 种 说 法 吗 ? 

ee 就 有 个 少 熏 芯 也 随 痢 安 朗 到 本 地 的 计算 机 
上 了 。 这 些 东 西 就 如 同 镍 “电力 ”一 样 ， 让 Python 拥 有 了 无 限 生 
We 能 够 非 党 经 而 易 举 地 免费 关 用 很多 楼. 所 以 ， 称 之 为 “ 自 市 电 
池 ”。 

那些 在 安装 Python 时 就 默认 己 经 安装 好 的 模块 被 称 为 “标准 库 ”。 

熟悉 标准 库 是 编程 之 必须 。 


6.2.1 引用 方式 





所 有 模块 都 服从 下 述 引 用 方式 ， 是 最 基本 的 、 也 是 最 常用 的 ， 还 是 
可 读 性 非常 好 的 : 


import modulename 


例如 : 


>>> import pprint 

>>> a = {"lang":"python", "book":"www.itdiffer.com", "teacher":"qiwsir", "goal":"fr 

>>> pprint.pprint(a) 

{'book': 'www.itdiffer.com', 
'goal': 'from beginner to master '， 
'lang': 'python', 

"teacher ': 'qiwsir'} 


在 对 模块 进行 说 明 的 过 程 中 ， 以 标准 库 pprint 为 例 。 


以 pprint.pprintO 的 方式 使 用 模块 中 的 一 种 方法 ， 这 种 方法 能 够 让 字 
典 格式 化 输出 。 看 看 结果 是 不 是 比 原 来 更 容易 疯 读 了 呢 ? 

















在 import 后 面 ， 理 论 上 可 以 跟 好 多 模块 名 称 ， 但 是 在 实践 中 ， 还 是 
建议 大 家 一 次 跟 一 个 名 称 ， 太 多 了 看 厦 头 尝 眼 伦 ， 不 容易 阅读 。 


这 是 用 import pprint 的 样式 引入 ， 并 以 点 号 “.”( 瑞 文 半角 ) 的 形式 
引用 其 方法 。 


还 有 下 面 的 方式 : 





>>> from pprint import pprint 


意思 是 从 pprint 模 块 中 只 将 pprint0 引 入 ， 之 后 就 可 以 直接 使 用 它 
J 


>>> pprint(a) 


{'book': 'www.itdiffer.com', 
'goal': 'from beginner to master '， 
'lang': 'python', 

"teacher ': 'qiwsir'} 


再 懒惰 一些 ， 可 以 : 


>>> from pprint import * 





将 pprint 模 块 中 的 一 切 都 引入 了 ， 于 是 可 以 像 上 面 那样 直接 使 用 每 
个 函数 。 但 是 ， 这 样 造成 的 结果 是 可 读 性 不 是 很 好 ， 并 且 ， 不 管 是 不 是 
用 得 到 ， 都 拿 过 来 ， 是 不 是 太 贪 禁 了 ? 信 禁 的 结果 是 内 存 会 消耗 不 少 。 
所 以 ， 这 种 方法 可 以 用 于 常用 的 并 且 模 块 属性 或 方法 不 是 很 多 的 情况 ， 


葛 贪 焚 。 








诚然 ， 如 果 很 明确 使 用 模块 中 的 哪些 方法 或 属性 ， 那 么 使 用 类 似 
from modulename import namel1，name2，name3... 也 未 尝 不 可 。 需 要 再 
次 提醒 的 是 不 能 因为 引入 了 模块 而 降低 了 可 读 性 ， 让 别人 不 知道 呈现 在 
眼前 的 方法 是 从 何 而 来 。 


有 时 候 引 入 的 模块 或 者 方法 名 称 有 点 长 ， 可 以 给 它 重 命名 。 如 : 














>>> import pprint as pr 

>>> pr.pprint(a) 

{'book': 'www.itdiffer.com', 
'goal': 'from beginner to master '， 
'lang': 'python', 

"teacher ': 'qiwsir'} 


>>> from pprint import pprint as pt 


>>> pt(a) 

{'book': 'www.itdiffer.com', 
'goal': 'from beginner to master '， 
'lang': "python '， 

"teacher ': 'qiwsir'} 


但 是 不 管 怎 么 样 ， 一 定 要 让 人 看 懂 ， 且 要 过 了 寿 干 时 间 ， 自 己 也 还 
能 看 懂 。 记 住 ， 软件 很 多 时 候 是 给 人 看 的 ， 只 是 侦 尔 让 机 器 执行 。 


6.2.2 ”深入 探究 


继续 以 pprint 为 例 ， 深 入 研究 : 


>>> import pprint 
>>> dir(pprint) 
['PrettyPrinter', '_StringI0', '_all ', '_ builtins ', '_doc ', '_file ', ' 





对 dir0 并 不 陌生 。 从 结果 中 可 以 看 到 pprint 的 属性 和 方法 。 其 中 有 不 
ee 


>>> [ m for m in dir(pprint) if not m.startswith('_') ] 
['PrettyPrinter', 'isreadable', 'isrecursive', 'pformat', 'pprint', 'saferepr', 'wa 


. 针对 这 几 个 ， 为 了 能 够 摘 清 楚 它们 的 含义 ， 可 以 使 用 heljp0， 比 
0D: 


>>> help(isreadable) 
Traceback (most recent call last): 

File "<stdin>", line 1, in <module> 
NameError: name 'isreadable' is not defined 


这 样 做 是 错误 的 ， 知 道 错 在 何 处 吗 ? 


>>> help(pprint.isreadable) 


前 面 是 用 import pprint 方 式 引 入 模块 的 : 


Help on function isreadable in module pprint: 
isreadable(object) 
Determine if saferepr(object) is readable by eval(). 


通过 帮助 信息 ， 能 够 查看 到 该 方法 的 详细 说 明 。 可 以 用 这 种 方法 一 
个 一 个 地 查 过 来 ， 对 每 个 方法 都 熟悉 一 些 。 





注意 pprint.PrettyPrinter 是 一 个 类 ， 后 面 的 是 函数 (方法 ) 。 
再 回头 看 看 dir (pprint〉 的 结 


>>> pprint. all _ 
['pprint', 'pformat', 'isreadable', 'isrecursive', 'saferepr', 'PrettyPrinter'] 


这 个 结果 是 不 是 眼熟 ? 除了 "warnings"， 跟 前 面 通过 列表 解析 式 得 
到 的 结果 一 样 。 


其 实 ， 当 我 们 使 用 from pprint import* 的 时 候 ， 就 是 将 _all 里面 的 
方法 引入 ， 如 果 没 有 这 个 ， 就 会 将 其 他 所 有 属性 、 方 法 等 引入 ， 包 括 那 
些 以 双 画 线 或 者 单 画 线 开 头 的 变量 、 函 数 ， 事 实 上 这 些 东西 很 少 在 引入 
模块 时 被 使 用 。 


6.2.3 帮助、 文档 和 源码 


你 能 记 住 每 个 模块 的 属性 和 方面 吗 ? 比如 前 面 刚刚 查询 过 的 pprint 
模块 中 的 属性 和 方法 ， 现 在 能 背诵 出 来 吗 ? 我 的 记忆 力 不 行 ， 都 记 不 
住 。 所 以 ， 我 非常 喜欢 使 用 dir0 和 help0， 这 也 是 本 书 从 开始 到 现在 ， 疙 
至 到 以 后 ， 总 在 提倡 的 方式 。 





>>> print pprint. doc _ 
Support to pretty-print lists, tuples, & dictionaries recursively. 


Very simple, but useful, especially in debugging data structures. 


Classes 


PrettyPrinter() 
Handle pretty-printing operations onto a stream using a configured 
set of formatting parameters. 


Functions 


pformat( ) 
Format a Python object into a pretty-printed representation. 


pprint() 
Pretty-print a Python object to a stream [default is sys.stdout]. 


saferepr() 
Generate a 'standard' repr()-like value, but protect against recursive 
data structures. 


pprint._doc”_ 是 查看 整个 类 的 文档 ， 还 知道 整个 文档 写 在 什么 地 方 
四? 


还 是 使 用 pm.py 那 个 文件 ， 增 加 如 下 内 容 : 


#!/UsSr/bin/env python 
# coding=utf-8 


Ihr # 增 加 的 
This is a document of the python module. # 增 加 的 


TEN TY # 增 加 的 


def lang(): 

















# 和 省 略 了 ， 后 面 的 也 省 略 了 

















在 这 个 文件 的 开始 部 分 ， 在 所 有 类 、 方 法 和 import 之 前 ， 写 一 个 用 
三 个 引号 包括 的 字符 串 ， 这 就 是 文档 。 


>>> import sys 

>>> sys.path.append("~/Documents/VBS/StarterLearningPython/2code") 
>>> import pm 

>>> print pm._ doc _ 


This is a document of the python module. 





这 就 是 撰写 模块 文档 的 方法 ， 即 在 .py 文件 的 最 开始 写 相 应 的 内 
容 ， 这 个 要 求 应 该 成 为 开发 者 的 习惯 。 


对 于 Python 的 标准 库 和 第 三 方 模块 ， 不 仅 可 以 看 帮助 信息 和 文档 ， 
还 能 够 查看 源码 ， 因 为 它 是 开放 的 。 

还 是 回头 到 dir (pprint) 中 找 一 找 ， 有 一 个 _file _， 它 就 告诉 我 们 
这 个 模块 的 位 置 : 


>>> print pprint. file _ 
/usr/lib/python2.7/pprint.pyc 








我 是 在 Ubuntu 中 操作 ， 读 者 要 注意 观察 目 己 的 操作 系统 结 


虽然 是 .pyc 文 件 ， 但 是 不 用 担心 ， 根 据 显 示 的 目录 ， 找 到 相应 的 .py 
文件 即 可 。 





$ ls /usr/lib/python2.7/pp* 
/usr/lib/python2.7/pprint.py /usr/lib/python2.7/pprint.pyc 


果然 有 一 个 pprint.py， 打 开 它 ， 束 看 到 源码 了 。 


$ cat /usr/lib/python2.7/pprint.py 


"""Support to pretty-print lists, tuples, & dictionaries recursively. 
Very simple, but useful, especially in debugging data structures. 


Classes 


PrettyPrinter() 
Handle pretty-printing operations onto a stream using a configured 
set of formatting parameters. 


Functions 


pformat() 
Format a Python object into a pretty-printed representation. 











我 只 但 抄 了 文档 中 的 部 分 信息 ， 古 不 是 跟前 面 通 过 doc _ 介 看 的 
结果 一 样 呢 ? 


请 读者 在 闲暇 时 间 阅 读 源码 。 事 实证 明 ， 这 种 标准 库 中 的 源码 是 质 





量 最 好 的 。 阅 读 高 质量 的 代码 ， 有 是 提高 编程 水 平 的 途径 之 一 。 


6.3 ”标准 库 


Python 标 准 库 的 内 容 非常 多 ， 有 人 专门 为 此 写 过 一 本 书 。 在 本 书 
中 ， 我 将 根据 目 己 的 理解 和 辟 好 ， 选 几 个 呈现 出 来 ， 一 来 显示 标准 库 之 
强大 功能 ， 二 来 演示 如 何 理 解 和 使 用 标准 库 。 








6.3.1 sys 
这 是 一 个 跟 Python 解 释 器 关系 密切 的 标准 库 ， 前 面 已 经 使 用 过 
sys.path.append()。 


>>> import sys 
>>> print sys. doc _ 


显示 了 sys 的 基本 文档 ， 第 一 句 话 概括 了 本 模块 的 基本 特点 。 


This module provides access to some objects used or maintained by the 
interpreter and to functions that interact strongly with the interpreter. 





在 诸多 sys 函 数 和 变量 中 ， 选 择 常 用 的 来 说 明 。 


1.sys.argv 


sys.argv 是 变量 ， 专 门 用 来 各 Python 解 释 器 传递 参数 ， 所 以 名 日 “ 命 
令 行 参 数 ”。 


先 解释 什么 是 命令 行 参数 。 


Vd 


$ python --version 
Python 2.7.6 


这 里 的 --version 束 是 命令 行 参数 ， 如 果 你 使 用 python--help 可 以 看 到 


更 多 : 


$ python --help 


usage: python [option] ... [-c cmd | -m mod | file | -] [arg] ... 

Options and arguments (and corresponding environment variables): 

-B : don't write ,py[co] files on import; also PYTHONDONTWRITEBYTECODE=X 
-C cmd : program passed in as string (terminates option list) 

-d : debug output from parser; also PYTHONDEBUG=X 

-E : ignore PYTHON* environment variables (Such as PYTHONPATH) 

-h : print this help message and exit (also --help) 

-I : inspect interactively after running script; forces a prompt even 


if stdin does not appear to be a terminal; also PYTHONINSPECT=X 
-m mod : run library module as a script (terminates option list) 


-0 : Optimize generated bytecode slightly; also PYTHONOPTIMIZE=x 
-00 : remove doc-strings in addition to the -0 optimizations 
-R : Use a pseudo-random salt to make hash() values of various types be 


unpredictable between separate invocations of the interpreter, as 
a defense against denial-of-service attacks 


只 选择 了 部 分 内 容 摆 在 这 里 。 所 看 到 的 如 -B、-h 之 流 ， 都 是 参数 ， 
比如 python-h， 其 功能 同上 ， 那 么 -h 也 是 命令 行 参数 。 
sys.arg 在 Python 中 的 作用 惑 是 这 样 ， 通 过 它 可 以 同 解释 器 传递 命令 
行 参数 。 比 如 : 
#!/UsSr/bin/env python 
# Coding=utf-8 


import sys 


print "The file name: ", sys.argv[0] 
print "The number of argument", len(sys.argv) 
print "The argument is: ", str(sys.argv) 


将 上 述 代 码 保存 ， 文 件 名 是 22101.py。 然 后 如 此 做 : 


$ python 22101.py 

The file name: 22101.py 

The number of argument 1 

The argument is: ['22101.py'] 


将 结果 和 前 面 的 代码 做 个 对 照 。 

(1) 在 $python 22101.py 中 ，“22101.py” 是 要 运行 的 文件 名 ， 同 时 
也 是 命令 行 参数 ， 是 前 面 的 Python 这 个 指令 的 参数 ， 其 地 位 与 python-h 
中 的 参数 -h 是 等 同 的 。 


(2) sys.argv[0] 是 第 一 个 参数 ， 束 是 上 面 提 到 的 22101.py， 即 文件 


名 。 
如 末 这 样 来 试 试 : 


$ python 22101.py beginner master www.itdiffer.com 

The file name: 22101.py 

The number of argument 4 

The argument is: ['22101.py', 'beginner', 'master', 'www.itdiffer.com'] 


在 这 里 用 sys.arg[1] 得 到 的 就 是 beginner， 依 次 类 推 。 


2.5ys.exit() 


» 


这 个 方法 的 意思 是 退出 当前 程序 。 


Help on built-in function exit in module sys: 


exit(...) 
exit([status]) 


Exit the interpreter by raising SystemExit(status). 

If the status is omitted or None, it defaults to zero (i.e., success). 
If the status is an integer, it will be used as the System exit status. 
If it is another kind of object, it will be printed and the system 
exit status will be one (i.e., failure). 


从 文档 信息 中 可 知 ， 如 果 用 sys.exit0 退 出 程序 ， 会 返回 SystemExit 
异常 。 这 里 先 告 知 读者 ， 还 有 男 外 一 种 退出 方式 : os._exit()， 这 两 个 有 
所 区 别 。 


#!/UsSr/bin/env python 
# coding=utf-8 


import sys 


for i in range(10): 
if i == 5: 
sys.exit() 
else: 
print i 


» 


这 段 程序 的 运行 结果 就 是 : 


$ python 22102.py 
0 
1 
2 


在 有 的 函数 中 (甚至 大 多 数 函 数 中 ) 会 用 到 return， 其 含义 是 终止 
当前 的 函数 ， 并 返回 相应 值 〈 如 果 没 有 就 是 None) 。 但 是 sys.exitO 的 含 
义 是 退出 当前 程序 ， 并 发 起 SystemExit 异 常 。 这 就 是 两 者 的 区 别 了 。 


使 用 sys.exit (0) 表示 正常 退出 ， 如 果 退 出 的 时 候 有 一 个 对 人 友好 
的 提示 信息 ， 可 以 用 sys.exit ("I wet out at here.") ， 那 么 字符 串 信息 就 
被 打印 出 来 。 





3.sys.path 


sys.path 己 经 不 卫生 了 ， 它 可 以 查找 模块 所 在 的 目录 ， 以 列表 的 形 
本 示 出 来 。 如 果 用 append0) 方 法 ， 惑 能够 同 这 个 列表 增加 新 的 模块 目 


ws 


4.sys.stdin, sys.stdout, sys.stderr 


将 这 三 个 放 到 一 起 ， 是 因为 他 们 的 变量 都 是 类 文件 流 对 象 ， 分 别 表 
示 标 准 UNIX 概 念 中 的 标准 输入 、 标 准 输出 和 标 与 Python 功能 能 
对 上 照 ，sys.stdin 获 得 输入 (用 raw_input0 输 入 的 通过 它 获得 ，Python 3.x 
中 是 imput()) ，sys.stdout 负 责 输出 。 


流 是 程序 输入 或 输出 的 一 个 连续 的 字 节 序列 ， 设 备 〈 例 如 鼠标 、 键 
盘 、 破 盘 、 屏 幕 、 调 制 解 调 器 和 打印 机 ) 的 输入 和 和 输出 都 是 用 流 来 处 理 
的 。 程 序 在 任何 时 候 都 可 以 使 用 它们 。 一 般 来 讲 ，stdin 输入》 并 不 一 
定 来 自 键盘 ，stdout( 输 出， 也 并 不 一 定 显示 在 屏幕 上 ， 它 们 都 可 以 重 
定 问 到 磁盘 文件 或 其 他 设备 上 。 


还 记得 print() 吧 ， 它 的 本 质 就 是 sys.stdout.write (object+\n') 。 





sys.stdout.write(object + '\n')。 


>>> for i in range(3): 
print i 


0 


工 
2 


>>> import sys 
>>> for i in range(3): 
sys.stdout.write(str(i)) 


造成 上 面 的 输出 结果 在 表象 上 有 如 此 差异 的 ， 原 因 就 是 那个 \n 的 有 


>>> for i in range(3): 
sys.stdout.write(str(i) + '\n') 


0 
工 
2 


从 这 里 可 以 看 出 ， 两 者 是 完全 等 效 的 。 如 果 仅 仅 止 于 此 ， 则 意义 不 
大 。 更 强大 的 在 于 通过 sys.stdout 能 够 做 到 将 输出 内 容 从 “控制 台 ” 转 
到 “文件 ”， 称 之 为 重 定 向。 这 样 也 许 控 制 台 看 不 到 很 多 时 候 这 个 不 重 
要 ) ,但 是 文件 中 已 经 有 了 要 输出 的 内 容 。 





>>> f = open("stdout.md", "w") 

>>> sys.stdout = f 

>>> print "Learn Python: From Beginner to Master" 
>>> f.close() 


当 sys.stdout=f 之 后 ， 就 意味 独 将 输出 目的 地 转 到 了 打开 《建立 ) 的 
文件 中 ， 然 后 用 print， 将 内 容 “ 打 印 ” 到 那个 文件 中 ， 在 控制 台 就 不 显 
现 。 

打开 文件 看 看 便 知 : 


$ cat stdout.md 
Learn Python: From Beginner to Master 


这 就 是 标准 输出 。 


男 外 两 个 ， 输 入 和 错误 也 类 似 ， 读 者 可 以 自行 测试 。 


6.3.2 copy 





前 面 对 浅 拷贝 和 深 找 贝 做 了 研究 ， 这 里 再 次 提出 ， 即 是 复习 ， 也 是 
次数 ， 以 显得 我 考虑 到 了 这 个 党 用 模块 。 
>>> import copy 


>>> copy._ all _ 
['Error', 'copy', 'deepcopy'] 


这 个 模块 中 常用 的 加 是 copy 和 deepcopy。 

为 了 具体 说 明 ， 看 这 样 一 个 例子 : 
#!/UsSr/bin/env python 
# Coding=utf-8 
import copy 
class MyCopy(object): 

def _ init (self, value): 
self.value = Value 


def __repr__(self): 
return str(self.value) 


foo = MyCopy(7) 


a= ["foo", foo] 

b= a[:] 

c = list(a) 

d = copy.copy(a) 

e = copy.deepcopy(a) 
a.append("abc") 


foo.value = 17 


print "original: %r\n slice: %r\n list(): %r\n copy(): %r\n deepcopy(): %r\n" % (ay 
YA 一 /一 
保存 并 运行 : 


$ python 22103 .py 

original: ['foo', 17, 'abc'] 
slice: ['foo', 17] 

list(): ['foo', 17] 

copy(): ['foo', 17] 
deepcopy(): ['foo', 7] 


读者 可 以 对 照 结果 和 程序 ， 束 能 理解 各 种 找 贝 的 实现 方法 和 含义 了 
一 一 深 拷 贝 和 浅 拷贝 。 


6.3.3 ”05 


os 模块 提供 了 访问 操作 系统 服务 的 功能 ， 它 所 包含 的 内 容 比 较 多 ， 
有 了 时候 感觉 很 神秘 。 


>>> import os 
>>> dir(os) 
['EX_CANTCREAT', 'EX_ CONFIG', 'EX_DATAERR', 'EX_IOERR', 'EX_NOHOST', "EX_NOINPUT '， 


这 么 多 内 容 不 能 都 介绍 ， 列 出 来 纯粹 是 要 吓 嘱 你 一 下 ， 先 混 个 脸 
熟 ， 将 来 用 到 哪个 了 ， 可 以 到 这 里 来 找 。 


下 面 介 绍 的 都 是 我 自 认 为 用 得 比较 多 的 ， 如 果 读 者 要 用 某 个 方法 或 
属性 ， 但 是 这 里 没有 介绍 ， 你 完全 可 以 自己 用 help0) 来 自学 ， 当 然 ， 还 
人 Google( 内 事 不 决 问 Google， 外 事 不 明 问 谷 
歌 ) 。 








1. 操 作文 件 : 重 命名 、 删 除 文件 


在 对 文件 进行 操作 的 时 候 ，openO 这 个 内 建 函 数 可 以 建立 、 打 开 文 
件 。 但 是 ， 如 果 对 文件 进行 改名 、 删 除 操作 ， 就 要 使 用 os 模块 的 方法 
Ts 


首先 建立 一 个 文件 ， 文 件 名 为 22201.py， 文 件 内 容 是 : 


#!/UsSr/bin/env python 
# coding=utf-8 


print "This is a tmp file." 


然后 将 这 个 文件 名 称 修改 为 别 的 名 称 。 


>>> import os 
>>> os.rename("22201.py", "newtemp.py") 


注意 ， 我 是 先进 入 到 了 文件 22201.py 的 目录 ， 然 后 再 进入 交互 模 
式 ， 所 以 ， 可 以 直接 写 文件 名 ， 如 果 不 是 这 样 ， 需 要 将 文件 的 路 径 写 
| 


os.rename ("22201.py"，"newtemp.py") 中 ， 第 一 个 文件 是 原文 件 
名 称 ， 第 二 个 是 打算 修改 成 为 的 文件 名 。 


然后 查看 ， 能 够 看 到 这 个 文件 。 


$ ls new* 
newtemp.py 


文件 内 容 可 以 用 cat newtemp.py 查 看 (这 是 在 Ubuntu 系 统 ， 如 果 是 
Windows 系 统 ， 可 以 用 其 相应 的 编辑 器 打开 文件 看 内 容 〉。 


除了 修改 文件 名 称 ， 还 可 以 修改 目录 名 称 ， 请 注意 阅读 帮助 信息 。 


Help on built-in function rename in module posix: 


rename(...) 
rename(old, new) 


Rename a file or directory. 


男 外 一 个 os.remove()， 首 先 看 帮助 信息 ， 然 后 再 实验 。 


Help on built-in function remove in module posix: 


remove(...) 
remove(path) 


Remove a file (same as unlink(path)). 


为 了 测试 ， 先 建立 一 些 文件 。 


$ pwd 
/home/qw/Documents/VBS/StarterLearningPython/2code/rd 


这 是 我 建立 的 临时 目录 ， 里 面 有 几 个 文件 : 


$ 1s 
a.py b.py c.py 


下 面 删除 apy 文 件 。 


>>> import os 
>>> os.remove("/home/qw/Documents/VBS/StarterLearningPython/2code/rd/a.py") 


看 看 删 了 吗 ? 


$ 1s 
b.py c.py 


果然 官 用 ， 再 来 一 个 狠 的 : 


>>> os.remove("/home/qw/Documents/VBS/StarterLearningPython/2code/rd") 
Traceback (most recent call last): 
File "<stdin>", line 1, in <module> 
OSError: [Errno 21] Is a directory: '/home/qw/Documents/VBS/StarterLearningPython/ 


报错 了 。 我 打算 将 这 个 目录 下 的 所 剩 文件 删 光 ， 但 这 么 做 不 行 。 注 
意 帮助 中 的 那 句 Remove a file，os.remove0O 就 是 用 来 删除 文件 的 。 并 且 
从 报错 中 也 可 以 看 到 ， 错误 的 原因 在 于 那个 参数 是 一 个 目录 。 


要 删除 目录 ， 还 得 继续 疝 下 学 习 。 








2. 操 作 目 录 
(1) os.listdir: 显示 目录 中 的 文件 。 


Help on built-in function listdir in module posix: 


listdir(...) 
listdir(path) -> list_ of_strings 


Return a list containing the names of the entries in the directory. 
path: path of directory to list 


The list is in a tary order. It does not include the special 
entries '.' and '..' even if they are present jin the directory. 








看 完 帮 助 信息 ， 读 者 一 定 觉 得 这 是 一 个 非常 简单 的 方法 ， 不 过 ， 要 
特别 注意 它 返 回 的 值 是 列表 ， 晶 不 显示 文件 夹 中 用 特殊 格式 命名 的 文件 
(它们 是 隐藏 文件 ) 。 在 Linux 中 ， 用 ]s 命 令 也 看 不 到 这 些 隐 藏 的 文件 。 








>>> os.listdir("/home/qw/Documents/VBS/StarterLearningPython/2code/rd") 
['b.py', 'c.py'] 
>>> files = os.listdir("/home/qw/Documents/VBS/StarterLearningPython/2code/rd") 
>>> for f in files: 

print f 
b.py 
Cc.py 





(2) os.getcwd，os.chdir: 当前 工作 目录 ， 改 变 当 前 工作 目录 。 


这 两 个 函数 怎么 用 ? 唯 有 通过 heljp0O 看 文档 了 ， 请 读者 自行 看 看 ， 
就 不 贴 出 来 了 ， 仅 演示 一 个 例子 : 


























录 


一 小 


>>> cwd = os.getcwd() # 当 前 





>>> print cwd 
/home/qw/Documents/VBS/StarterLearningPython/2code/rd 
>>> os.chdir(os.pardir) # 进 入 到 上 一 级 














>>> os.getcwd() # 当 前 





'/home/qw/Documents/VBS/StarterLearningPython/2code' 














>>> os.chdir("rd") # 进 入 下 级 


>>> os.getcwd() 
'/home/qw/Documents/VBS/StarterLearningPython/2code/rd'" 


os.pardir 的 功能 是 获得 父 级 目录 ， 相 当 于 “..”。 


>>> os.pardir 
1 1 


(3) os.makedirs，os.removedirs: 创建 和 删除 目录 。 
直接 上 例子 : 


>>> dir = os.getcwd() 
>>> dir 
'/home/qw/Documents/VBS/StarterLearningPython/2code/rd' 
>>> os.removedirs(dir) 
Traceback (most recent call last): 

File "<stdin>", line 1, in <module> 

File "/usr/lib/python2.7/0s.py", line 170, in removedirs 

rmdir (name) 

OSError: [Errno 39] Directory not empty: 
'/home/qw/Documents/VBS/StarterLearningPython/2code/rd' 


什么 时 候 都 不 能 得 意 生 形 ， 一 定 要 谦卑 ， 从 看 文档 开始 一 点 一 氮 地 
理解 。 看 报错 信息 ， 要 删除 茶 个 目录 ， 则 那个 目录 必须 是 空 的 。 





>>> 0S.getcwd() 
'/home/qw/Documents/VBS/StarterLearningPython/2code' 





这 是 当前 目录 ， 在 这 个 目录 下 再 建 一 个 新 的 子 目 录 : 


>>> os.makedirs("newrd") 

>>> os.chdir("newrd") 

>>> os.getcwd() 
'/home/qw/Documents/VBS/StarterLearningPython/2code/newrd' 





吕 建立 了 一 个 。 下 面 把 刚刚 建立 的 这 个 目录 删除 ， 坚 无 疑问 它 是 空 


>>> os.listdir(os.getcwd()) 


>>> newdir = os.getcwd() 
>>> os.removedirs(newdir) 





按照 我 的 理解 ， 这 里 应 该 报错 。 因 为 我 是 在 当前 工作 目录 删除 当前 
工作 目录 ， 如 果 这 样 能 够 执行 ， 总 觉得 有 点 别扭 。 但 事实 上 行 得 通 ， 就 
算是 Python 的 规定 吧 。 不 过 ， 若 让 我 来 确定 这 个 功能 的 话 ， 还 是 习惯 不 
能 在 本 地 删除 本 地 。 


按照 上 面 的 操作 ， 再 看 当前 的 工作 目录 : 





>>> os.getcwd() 
Traceback (most recent call last): 

File "<stdin>", line 1, in <module> 
OSError: [Errno 2] No such file or directory 


目录 被 删 了 了， 只 能 回 到 父 级 


>>> os.chdir(os.pardir) 
>>> os.getcwd() 
'/home/qw/Documents/VBS/StarterLearningPython/2code' 





有 所 不 可 思议 ， 本 来 没有 当前 工作 目录 ， 怎 么 会 有 “ 父 级 ” 呢 ? 但 现 
实 就 是 这 样 。 


补充 一 点 ， 前 面 说 的 如 果 目 录 不 空 ， 束 不 能 用 os.removedirsO 删 





除 。 但 是 ， 可 以 用 模块 shutil 的 retree 方 法 。 


>>> os.getcwd() 


'/home/qw/Documents/VBS/StarterLearningPython/2code' 
>>> os.chdir("rd") 

>>> now = os.getcwd() 

>>> now 
'/home/qw/Documents/VBS/StarterLearningPython/2code/rd' 
>>> os.1listdir(now) 

['b.py', 'c.py'] 

>>> import shutil 

>>> shutil.rmtree(now) 

>>> os.getcwd() 

Traceback (most recent call last): 

File "<stdin>", line 1, in <module> 

OSError: [Errno 2] No such file or directory 





请 读者 注意 ， 对 于 os.makedirs() 还 有 这 样 的 特点 : 


>>> os.getcwd() 
'/home/qw/Documents/VBS/StarterLearningPython/2code' 
>>> d0 = os.getcwd() 

>>> d1 = do+"/ndir1i/ndir2/ndir3" # 这 是 想 建立 的 目录 ， 但 是 











ndir1, ndir2 也 都 不 存在 。 


>>> d1 
'/home/qw/Documents/VBS/StarterLearningPython/2code/ndiri/ndir2/ndir3' 
>>> os.makedirs(d1) 

>>> os.chdir(d1) 

>>> os.getcwd() 
'/home/qw/Documents/VBS/StarterLearningPython/2code/ndir1i/ndir2/ndir3" 


不 存在 的 目录 也 被 建立 起 来 ， 直 到 做 右边 的 目录 为 止 。 与 
os.makedirs() 类 似 的 还 有 os.mkdir()， 不 过 ，os.mkdir() 没 有 上 面 这 个 功 
能 ， 它 只 能 一 层 一 层 地 建 日 录 。os.removedirs() 和 os.rmdir() 也 类 似 ， 区 
别 也 类 似 上 面 。 





3. 文 件 和 目录 属性 


不 管 是 哪 种 操作 系统 ， 都 能 看 到 文件 或 者 目录 的 有 关 属 性 ， 那 么 ， 
在 os 模块 中 ， 也 有 这 样 的 一 个 方法 : os.stat()。 





>>> p = os.getcwd() # 当 前 目录 





>>> p 
'/home/qw/Documents/VBS/StarterLearningPython' 





>>> os.stat(p) 
posix.stat_result(st_mode=16895, st_ino=4L, st_dev=26L, st_nlink=1, st_uid=0, st_gi 


再 指定 一 个 文件 : 


>>> pf = p + "/README.md" 


显示 此 文件 的 信息 : 


>>> os.stat(pf) 
posix.stat_result(st_mode=33279, st_ino=67L, st_dev=26L, st_nlink=1, st_uid=0, st_g 


从 结果 中 看 ， 可 能 看 不 出 什么 来 ， 先 不 用 着 急 。 这 样 的 结果 对 
0 
1 


>>> fi 
>>> mt 


os.stat(pf) 
fi[8] 


fi[8] 束 是 st_mtime 的 值 ， 它 代表 最 后 modified (修改 〉 文件 的 时 间 。 
看 结果 : 


>>> mt 
1429580969 








还 是 不 友好 ， 下 面 用 time 模 块 来 友好 一 下 : 


>>> import time 
>>> time.ctime(mt) 
'Tue Apr 21 09:49:29 2015 


现在 就 对 读者 友好 了 。 


用 os.stat0) 能 够 查看 文件 或 者 目录 的 属性 。 如 果 要 修改 呢 ? 比如 在 音 
署 网 站 的 时 候 ， 第 第 要 修改 目录 或 者 文件 的 权限 等 。 这 种 操作 在 Python 





的 os 模块 能 做 到 吗 ? 


要 求 越 来 越 多 了 。 一 般 情 况 下 ， 不 在 Python 里 做 这 个 ， 当 然 ， 世 界 
古 复 杂 的 ， 肯 定 有 人 会 用 到 的 ， 所 以 os 模块 提供 了 os.chmod() 


4. 操 作 命 令 


读者 如 果 使 用 某 种 Linux 系 统 ， 或 者 曾经 用 过 DOS 矶 怕 很 少 )， 
或 者 在 Windows 里 面 用 过 command， 对 敲 命 令 都 不 卫生 。 通 过 命令 来 做 
事情 的 确 是 很 酷 的 ， 比 如 ， 我 在 Ubuntu 中 ， 要 查看 文件 和 目录 ， 只 需要 
1s 就 足够 了 。 我 并 不 是 否认 图 形 界 面 ， 对 于 某 些 人 《比如 程序 员 ) 在 某 
些 情 况 下 ， 命 令 是 不 错 的 选项 ， 甚 至 是 离 不 开 的 。 


os 模块 中 提供 了 这 样 的 方法 ， 许 可 程序 员 在 Python 程序 中 使 用 操作 
系统 的 命令 。 【以 下 是 在 Ubuntu 系统 ， 如 果 读 者 是 Windows 系 统 ， 可 以 
将 命令 换 成 DOS 命 令 。) 











>>> p 
'/home/qw/Documents/VBS/StarterLearningPython' 
>>> command = "ls " +p 

>>> command 

'ls /home/qw/Documents/VBS/StarterLearningPython' 





为 了 输入 方便 ， 采用 了 前 面 例子 中 己 经 有 的 那个 目录 ， 并 且 ， 用 拼 
接 字 符 串 的 方式 ， 将 要 输入 的 命令 (查看 某 文件 夹 下 的 内 容 〉 组 装 成 一 
个 字符 串 ， 赋 值 给 变量 command， 然 后 : 





>>> os.system(command) 

91.md 101.md 105.md 109.md 113.md 11i7.md 121.md 125.md 129.md 201.md 
02 .md 102.md 106.md 110.md 114.md 118.md 122.md 126.md 130.md 202 .md 
03 .md 103,md 107.md 111.md 1i5.md 119.md 123.md 127.md 1code 203 ,md 
Qimages 104.md 108,md 112.md 116.md 120.md 124.md 128.md 1images 204.md 
0 


Nm 





这 样 就 列 出 来 了 该 目录 下 的 所 有 内 容 。 


需要 注意 的 是 ，os.system() 是 在 当前 进程 中 执行 命令 ， 直 到 它 执行 
结束 。 如 果 需 要 一 个 新 的 进程 ， 可 以 使 用 os.exec 或 者 os.execvp。 对 此 有 
兴趣 详细 了 解 的 读者 ， 可 以 查看 帮助 文档 了 解 。 男 外 ，os.system() 通 过 
shell 执 行 命令 ， 执 行 结束 后 将 控制 权 返 回 到 原来 的 进程 ， 但 是 0s.exec() 
及 相关 的 函数 ， 则 在 执行 后 不 将 控制 权 返 回 到 原 继承 ， 从 而 使 Python 失 








去 控制 。 
关于 Python 对 进程 的 管理 ， 此 处 暂 不 介绍 。 


os.system() 是 一 个 用 途 很 多 的 函数 。 曾 有 一 个 朋友 网 上 询问 ， 用 它 
来 月 动 浏览 器 。 不 过 ， 这 个 操作 的 确 要 非常 仔细 ， 为 什么 呢 ? 演示 一 下 
束 明 白 了 。 

>>> os.system("/usr/bin/firefox") 


(process:4002): GLib-CRITICAL **: g_ slice set_ config: assertion 'sys_page_ size == 0 


(firefox:4002): GLib-GObject-wARNING **: Attempt to add property GnomeProgram:: sm- 


我 是 在 Ubuntu 上 操作 的 ， 浏 览 器 的 地 址 是 /usr/bin/firefox， 可 是 ， 若 
朋友 是 windows 系 统 ， 那 么 就 要 非常 小 心 了 ， 因 为 在 Windows 里 面 ， 表 
示 路 径 的 斜 杜 跟 上 面 显 示 的 是 反 着 的 ， 可 是 在 Python 中 “\* 代 表 转 义 。 比 
较 简 单 的 一 个 方法 是 用 r"c:\userifirfox.exe" 的 样式 ， 因 为 在 r" 中 的 ， 都 被 
认为 是 原始 字符 。 而 且 在 Windows 系 统 中 ， 一 般 情 况 下 那个 文件 不 是 安 
闭 在 我 演示 的 那个 简单 样式 的 文件 夹 中 ， 而 是 安装 在 “C:\Program 
Files”， 这 中 间 有 空格 ， 所 以 还 要 注意 空格 问题 。 读 者 按照 这 些 提示 ， 
看 看 能 不 能 完成 用 os.system() 启 动 firefox 的 操作 。 


凡是 感觉 麻烦 的 东西 ， 必 然 有 另外 简单 的 方法 来 蔡 代 。 于 是 又 有 了 
一 个 webbrowser 模 块 ， 可 以 专门 用 来 打开 指定 网 页 。 





>>> import webbrowser 
>>> webbrowser .open("http://www.itdiffer.com") 
True 


不 管 是 什么 操作 系统 ， 只 要 如 上 操作 就 能 打开 网 页 。 


真是 神奇 的 标准 库 ， 有 如 此 多 的 工具 ， 能 不 加 速 开发 进程 吗 ? 能 不 
降低 开发 成 本 吗 ?“ 人 生 苦 短 ， 我 用 Python”! 





6.3.4 heapgqg 


堆 (Cheap) ， 是 一 种 数据 结构 ， 引 用 维基 百科 中 的 说 明 : 


堆 〈 英 语 : heap) ， 是 计算 机 科学 中 一 类 特殊 的 数据 结构 的 统称 。 
堆 通 党 是 一 个 可 以 和 补 看 作 一 株 树 的 数组 对 象 。 


对 于 这 个 新 的 概念 ， 读 者 不 要 心 慨 意 乱 或 者 恐惧 ， 因 为 它 本 质 上 不 
是 新 东西 ， 而 是 在 我 们 已 经 熟知 的 知识 基础 上 扩展 出 来 的 内 容 。 


堆 的 实现 是 通过 构造 二 又 堆 ， 也 就 是 一 种 二 又 树 。 


基本 知识 


这 和 古 一 条 在 苏州 很 币 见 的 香 樟 树 ， 马 路 两 边 、 公 园 里 随处 可 见 ， 特 
别 是 在 艳阳 高 照 的 时 候 ， 它 的 树 戎 能 把 路 面 遮 兰 。 








但 是 ， 在 编程 中 ， 我 们 第 次 的 树 是 这 样 的 : 





这 是 一 棵 “ 根 ? 在 上 面 的 树 ， 也 是 编程 中 种 说 的 树 。 为 什么 会 这 样 
呢 ? 我 想 主要 是 画 厦 更 方便 吧 。 上 面 那 哥 树 虽然 根 在 上 面 了 ， 还 完全 是 
写实 的 作品 ， 但 本 人 作为 一 名 隐姓埋名 多 年 的 抽象 派 画家 ， 不 喜欢 这 样 
的 树 ， 我 画 出 来 是 这 样 的 : 





这 标 树 有 两 根 枝 权 ， 可 不 要 小 看 这 两 根 校 权 ，《 道 德 经 》 上 说 “一 
生 二 ， 二 生 三 ， 三 生 万 物 ”。 一 就 是 下 面 那个 树干 ， 二 就 是 两 个 术 权 ， 
每 个 校 权 还 可 以 看 作 下 一 个 一 ， 然 后 再 有 两 个 枝 权 ， 如 此 不 断 重复 (这 
简直 就 是 递归 呀 ) ， 束 成 为 了 一 标 大 树 。 


这 标 树 画 成 这 样 束 更 符合 编程 的 习惯 了 ， 可 以 向 下 不 断 延 伸 。 











并 且 给 它 一 个 正规 的 名 字 ; 二 又 树 。 
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这 个 也 是 二 又 树 ， 完 全 脱胎 于 我 所 画 的 后 现代 抽象 主义 作品 ， 但 也 
略 有 不 同 ， 这 幅 图 在 各 个 枝 权 上 显示 的 是 数字 。 这 种 类 型 的 “ 树 ” 束 是 编 
程 语 言 中 所 说 的 二 叉 树 ， 维 基 百 科 日 : 


在 计算 机 科学 中 ， 二 叉 树 (英语 : Binary tree〉 是 每 个 节点 最 多 有 

















两 个 子 树 的 树 结 构 。 通 常 子 树 被 称 作 “ 左 子 树 ”(left subtree〉 和 “ 右 子 
树 ”(right subtree〉。 二 叉 树 常 被 用 于 实现 二 又 查 找 树 和 二 又 堆 。 


在 上 图 的 二 又 树 中 ， 最 顶端 的 那个 数字 相当 于 树 根 ， 也 称 作 “ 根 ”。 
每 个 数字 所 在 位 置 成 为 一 个 节点 ， 每 个 节点 同 下 分 散 出 两 个 “ 子 节 点 ”。 
并 不 是 所 有 节点 都 有 两 个 子 节 点 ， 比 如 上 图 的 最 后 一 层 ， 这 类 二 叉 树 又 
称 为 完全 二 又 树 (Complete Binary Tree) ， 有 的 二 叉 树 ， 所 有 的 节点 都 
有 两 个 子 节 点 ， 这 类 二 又 树 称 作 满 二 又 树 (Full Binarry Tree) ， 如 下 
图 。 


下 面 讨论 的 对 象 是 通过 二 又 树 实现 的 ， 其 具有 如 下 特点 : 


。 市 反 的 值 大 于 等 于 (或 者 小 于 等 于 ) 任何 子 节 点 的 值 。 

。 市 反 左 子 树 和 右 子 树 是 一 个 二 又 堆 。 如 果 父 市 反 的 值 总 大 于 等 于 任 
何 一 个 子 节 点 的 值 ， 其 为 最 大 堆 ;， 知 父 节 点 的 值 总 小 于 等 于 子 市 所 
值 ， 则 为 最 小 堆 。 上 面 图 示 中 的 完全 二 又 树 ， 就 表示 一 个 最 小 堆 。 


堆 的 类 型 还 有 别 的 ， 如 韭 波 那 契 堆 等 ， 但 很 少 用 。 所 以 ， 通 常 将 二 
ee 
和。 





























2. 堆 的 存储 


堆 用 列表 来 表示 ， 如 图 6-1 所 示 。 


X 他 
/ 7 ee 
(4) (5) 局 2 
(a) 有 逻辑 结构 (b) 存 储 结 构 


图 6-1 用 列表 来 表示 堆 


从 图 示 中 可 以 看 出 ， 将 人 逻辑 结构 中 的 树 的 市 点数 字 依 次 填 入 到 存储 
结构 中 。 看 这 个 图 ， 似 乎 是 列表 中 按照 顺序 进行 排列 似 的 。 但 是 ， 这 仅 
仅 是 由 于 那个 树 的 特点 造成 的 ， 如 果 是 下 面 的 树 : 


A 


将 上 面 的 逻辑 结构 转换 为 存储 结构 ， 读 者 束 能 看 出 来 了 ， 不 再 是 近 
照 顺序 排列 的 了 。 


关于 堆 的 各 种 操作 ， 如 插入 、 删 除 、 排 序 等 ， 本 节 不 会 专门 叙述 ， 
读者 可 以 参阅 有 关 资 料 。 下 面 要 介绍 如 何 用 Python 中 的 模块 heapq 来 实 
现 这 些 操作 。 











3.heapq 模 块 
heapq 中 的 heap 是 堆 ，q 就 是 queue (队列) 的 缩写 。 此 模块 包括 : 


>>> import heapq 
>>> heapq._ all _ 
['heappush', 'heappop', 'heapify', 'heapreplace', 'merge', 'nlargest', 'nsmallest', 


依次 查看 这 些 函 数 的 使 用 方法 。 
。 heappush (heap，x) : 将 x 压 入 堆 heap( 这 是 一 个 列表 ) 。 


Help on built-in function heappush in module _heapq: 


heappush(...) 
heappush(heap, item) -> None. Push item onto heap, maintaining the heap invaria 


>>> import heapq 

>>> heap = [] 

>>> heapq.heappush(heap, 3) 
>>> heapq.heappush(heap, 9) 
>>> heapq.heappush(heap, 2) 
>>> heapq.heappush(heap, 4) 
>>> heapq.heappush(heap, 0) 
>>> heapq.heappush(heap, 8) 
>>> heap 

[0, 2, 3, 9, 4, 8] 


请 读者 注意 上 面 的 操作 ， 在 回 堆 增加 数值 的 时 候 并 没有 严格 按照 什 
么 顺序 ， 是 随意 的 。 但 是 ， 当 奋 看 堆 的 数据 时 ， 显 示 的 是 一 个 有 一 定 顺 
序 的 数据 结构 。 这 种 顺序 不 是 按照 从 小 到 大 ， 而 是 按照 前 面 所 说 的 完全 
二 叉 树 的 方式 排列 ， 显 示 的 是 存储 结构 ， 可 以 把 它 还 原 为 逻辑 结构 ， 看 
看 是 不 是 一 柠 二 又 树 。 
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由 此 可 知 ， 利 用 heappush() 函 数 将 数据 放 到 堆 里 面 之 后 ， 会 自动 按 
照 二 又 树 的 结构 进行 存储 。 


。 heappop (Cheap) : 删除 最 小 元 素 。 
承接 上 面 的 操作 : 
>>> heapq.heappop (heap) 
0 


>>> heap 
[2, 4, 3, 9, 8] 





用 heappopO 函 数 ， 从 heap 堆 中 删除 了 一 个 最 小 元 素 ， 并 且 返 回 该 
值 。 但 是 ， 这 时 候 的 heap 显 示 顺 序 ， 并 非 简单 地 将 0 去 除 ， 而 是 按照 完 
全 二 又 树 的 规范 重新 进行 排列 。 


。 heapify(): 将 列表 转换 为 堆 。 
如 果 已 经 建立 了 一 个 列表 ， 利 用 heapifyO 可 以 将 列表 直接 转化 为 
六。 


>>> hl = [2, 4, 6, 8, 9, 0, 1, 5, 3] 
>>> heapq.heapify(h1) 

>>> hl 

[0, 3, 1, 4, 9, 6, 2, 5, 8] 


经 过 这 样 的 操作 ， 列 表 l 惑 变 成 了 堆 《〈 挫 的 顺序 和 列表 不 同 ) ， 可 





以 对 hl 〈 扒 ) 使 用 heappopO 或 者 heappushO 等 函数 了 。 人 和 否则， 不 可 。 


>>> heapq.heappop(h1) 
0 
>>> heapq.heappop(h1) 
工 


>>> hl 

[2, 3, 5, 4, 9, 6, 8] 
>>> heapq.heappush(hl, 9) 
>>> hl 

[2, 3, 5, 4, 9, 6, 8, 9] 








不 要 认为 堆 里 面 只 能 放 数 字 ， 举 例 中 之 所 以 用 数字 ， 是 因为 对 它 的 
逻辑 结构 比较 好 理解 。 


>>> heapq.heappush(hl, "q") 

>>> hl 

[2, 3, 5, 4, 9, 6, 8, 9, 'q'] 

>>> heapq.heappush(hl, "w") 

>>> hl 

[2, 3, 5， 4, 9, 6, 8, 9, 'q', 'w'] 


e heapreplace()。 


是 heappopO0 和 heappushO 的 联合 ， 也 束 是 删除 一 个 的 同时 再 加 入 一 
个 。 例 如 : 


>>> heap 

[2, 4, 3, 9, 8] 

>>> heapq.heapreplace(heap, 3.14) 
之 

>>> heap 

[3, 4, 3.14, 9, 8] 





先 简单 罗列 关于 堆 的 几 个 第 用 函数 。 那 么 堆 在 编程 实践 中 的 用 途 有 
哪些 呢 ? 排序 是 一 个 应 用 方面 。 一 提 到 排 夺 ， 读 者 肯定 想到 的 是 sorted() 
或 者 列表 中 的 sort()， 这 两 个 部 是 常用 的 函数 ， 而 且 在 一 般 情况 下 已 经 中 
够 使 用 了 。 但 如 果 使 用 堆 排 序 ， 相 对 于 其 他 排序 ， 也 有 自己 的 优势 。 不 
同 的 排 友 方 法 有 不 同 的 特点 ， 读 者 可 以 上 自行 深入 研究 不 同 排序 的 优 务 。 


6.3.5 deque 


有 这 样 一 个 问题 ， 一 个 列表 ， 比 如 是 [1，2，3]， 在 最 右边 增加 一 个 


数字 。 
这 也 太 简 单 了 ， 不 就 是 用 appendO 这 个 内 建 函 数 追 加 一 个 吗 ? 
这 是 简单 ， 但 能 不 能 在 最 左边 增加 一 个 数字 呢 ? 


这 个 应 该 有 办 法 ， 不 过 得 想 想 。 读 者 在 向 下 阅读 之 前 ， 能 不 能 想 出 
I 


>>> lst = [1, 2, 3] 
>>> lst.append(4) 
>>> lst 

[1, 2, 3, 4] 

>>> nl = [7] 

>>> nl.extend(1st) 
>>> nl 

[7, 1, 2, 3, 4] 


你 或 许 还 有 别 的 方法 。 但 是 ，Python 为 我 们 提供 了 一 个 更 简单 的 模 
块 来 解决 这 个 问题 。 


>>> from collections import deque 


这 里 用 这 种 引用 方法 是 因为 collections 模 块 中 东西 很 多 ， 我 们 只 用 
到 deque。 


>>> lst 
[1, 2, 3, 4] 


是 这 个 列表 ， 试 试 分 别 从 右边 和 左边 增加 数字 。 


>>> qlst = deque(1lst) 


这 是 必需 的 ， 将 列表 转化 为 dedque。deque 在 汉语 中 有 一 个 名 字 ， 叫 
作 “ 双 端 队列 ”。 (double-ended queue) 。 


>>> qlst.append(5) 让 从 有 过 增加 


>>> qlst 
dedue([1，2，3，4，5]) 
>>> qlst.appendleft(7) # 从 左边 增加 


>>> qlst 
deque([7?, 1, 2, 3, 4, 5]) 


这 样 操作 多 么 容易 呀 ， 继 续 看 删除 : 


>>> qlst .pop() 
5 


>>> qlst 

deque([7, 1, 2, 3, 4]) 
>>> qlst.popleft() 

J 

>>> qlst 

deque([1, 2, 3, 4]) 


删除 也 分 左右 。 下 面 这 个 ， 请 读者 仔细 观察 。 


>>> qlst.rotate(3) 
>>> qlst 
deque([2, 3, 4, 1]) 


1 功能 是 将 [1，2，3， 汪 的 首位 连 起 来 ， 你 就 想象 一 个 国 
二 如 果 一 开始 正 对 着 你 的 是 1， 依 顺 
时 针 方向 排列 ， 就 是 从 1 开始 的 数列 ， 如 图 6-2 所 示 。 


过 就 发 生 ; 是 个 每 个 
经 过 rotate()， 这 个 环 就 发 生 旋转 了 ， 如 未 是 rotate ， 表 
数字 按照 顺 时 针 方 同 前 进 三 个 位 置 ， 于 是 变 成 了 如 图 6-3 所 示 的 样子 。 





个 


图 6-2 ”数字 排列 





图 6-3 ”数字 按 顺 时 针 方 向 前 进 


请 原谅 我 的 后 现代 主义 超级 抽象 派 作 图 方式 。 从 图 中 可 以 看 出 ， 数 
列 变 成 了 [2，3，4，1]。rotate0) 就 好 像 在 拨 转 这 个 圆 环 。 


>>> qlst 
deque([3, 4, 1, 2]) 
>>> qlst.rotate(-1) 
>>> qlst 
deque([4, 1, 2, 3]) 


如 果 参 数 是 负数 ， 那 么 就 逆 时 针 转 。 
在 deque 中 ， 还 有 extend 和 extendleft 方 法 ， 读 者 可 自己 调试 。 


6.3.6 calendar 


>>> import calendar 


>>> cal = calendar .month(2015，1) 
>>> print cal 
January 2015 
Mo Tu We Th Fr Sa Su 
1 2 3 4 

5 6 7 8 910 11 
12 13 14 15 16 17 18 
19 20 21 22 23 24 25 
26 27 28 29 30 31 





轻而易举 得 到 了 2015 年 1 月 的 日 历 ， 并 且 排 列 还 那么 整齐 ， 这 就 是 
calendar 模 块 。 读 者 可 以 用 dir0 去 查看 这 个 模块 下 的 所 有 内 容 。 为 了 让 读 
者 阅读 方便 ， 将 常用 的 整理 如 下 : 


e calendar(year,w=2,l=1,c=6) 











返回 year 年 年 历 ， 3 个 月 一 行 ， 间隔 距离 为 c， 每 日 宽度 间隔 为 w 字 
符 ， 每 行 长 度 为 21*W+18+2*C，] 是 每 星期 行 数 。 


>>> year = calendar.calendar(2015) 
>>> print year 


因为 显示 的 内 容 太 多 ， 所 以 只 将 部 分 内 容 截 取 下 来 ， 如 图 6-4 所 


人 钞 。 
2815 
January February March 
Mo Tu We Th Fr Sa Su Mo Tu We Th Fr Sa Su Mo Tu We Th Fr Sa Su 
0 本 和 


Sa 7 全 人 7 
2243 44 45 46 T7418 
19 280 21 :22 23 22425 
26 27 28 7129 30 31 


之 人 
9 I Tl 2 T3014 13 
16 17 T8019 20'21 22 
23 24 25 26 27 28 





图 6-4 ”2015 年 日 历 





> 
$10 31 12 3. 14 43 
16 "17 28 19°20721 .22 
3 2 22027. 28 29 
3 31 


和 将 2015 年 度 的 各 个 月 份 日 历 完 全 显 
示 出 来 。 


e。 isleap(year) 


判断 是 否 为 周年， 是 则 返回 True， 人 否则 False。 


>>> Calendar ,1ISsleap(2000) 
True 
>>> Calendar ,Isleap(2015 ) 
False 


怎么 判断 一 年 是 间 年 的 问题 ， 常 常见 诸 一 些 编程 语言 的 练习 题 ， 现 
在 用 一 个 方法 搞定 。 





e leapdays(y1,y2) 


返回 在 yY1、yY2 两 年 之 间 的 国 年 总 数 ， 包 括 y1， 但 不 包括 y2， 这 有 点 
如 同 序列 的 切片 。 
>>> calendar .leapdays(2000,2004) 


>>> calendar .leapdays(2000,2003) 
1 


。 month(year, month, w=2, l=1) 








返回 year 年 month 月 日 历 ， 两 行 标题 ， 一 周一 行 。 每 日 宽度 间隔 为 w 
字符 ， 每 行 的 长 度 为 7z*w+6，] 是 每 星期 的 行 数 。 


>>> print calendar ,month(2015，5) 
May 2015 

Mo Tu We Th Fr Sa Su 
工 . -2 
4 5 6 7 8 9 19 
11 12 13 14 15 16 17 
18 19 20 21 22 23 24 
25 26 27 28 29 30 31 


e monthcalendar(year, month) 


返回 一 个 列表 ， 列 表 内 的 元 素 还 是 列表 ， 这 叫 作 构 套 列表 。 每 个 子 
0 都 是 从 星期 一 到 星期 日 ， 如 果 没 有 本 月 的 日 期 ， 则 
为 0。 


>>> Calendar ,monthcalendar(2015，5) 
[[9, 0, 0, 0, 1, 2, 3], [4, 5, 6, 7, 8, 9, 10], [11, 12, 13, 14, 15, 16, 17], [18, 


读者 可 以 将 这 个 结果 和 calendar.month (2015，5) 去 对 照 理 解 。 


。 monthrange(year,month) 


返回 一 个 元 组 ， 里 面 有 两 个 整数 。 第 一 个 整数 代表 着 该 月 的 第 一 天 
依次 为 星期 一 、 星 期 二 ......6 代 表 星 期 日 )。 


从 星期 几 开 始 ( 从 0 开始 ， 
第 二 个 整数 代表 该 月 一 共 多 少 天 。 


>>> Calendar ,monthrange(2015，5) 
(4, 31) 
从 返回 值 可 知 ，2015 年 5 月 1 日 是 星期 五 ， 这 个 月 一 共 31 天 。 这 个 结 


果 ， 也 可 以 从 日 历 中 看 到 。 
。 weekday(year,month,day) 
输入 年 月 日 ， 知 道 该 日 是 星期 几 注意， 返回 值 依然 按照 从 0 到 6 依 
次 对 应 星期 一 到 星期 六 ) 。 


>>> Calendar .weekday(2015，5，4) 

















# 星 期 一 























# 星 期 四 








0 
>>> calendar .weekday(2015, 6, 4) 


6.3.7 time 
下 面 全 于 





time 模 块 很 常用 ， 比 如 记录 某 个 程序 运行 时 间 长 短 等 
来 其 中 的 方法 。 


e timel() 


>>> import time 
>>> time.time() 
1430745298.391026 


time. ny (严格 说 是 时 间 惟 ) ， 只 不 过 这 个 时 
间 对 人 不 友好 ， 它 是 以 1970 年 1 月 1 日 0 时 0 分 0 秒 为 计时 起 点 ， 到 当前 的 


时 间 长 度 《 不 涯 虑 闫 秒 )， 





UNIX 时 间 ， 或 称 POSIX 时 间 是 UNIX 或 类 UNIX 系 统 使 用 的 时 间 表 
示 方 式 : 从 格林 威 治 时 间 1970 年 1 月 1 日 0 时 0 分 0 秒 起 至 现在 的 总 秒 数 ， 
不 考虑 周 秒 。 


现时 大 部 分 使 用 的 UNIX 的 系统 都 是 32 位 的 ， 即 它们 会 以 32 位 二 进 
制 数字 表示 时 间 。 但 是 它们 最 多 只 能 表示 至 协调 世界 时 间 2038 年 1 月 19 
日 3 时 14 分 07 秒 〈 二 进 制 : 01111111111111111111111111111111， 
0x7FFF:FFFF) ， 在 下 一 秒 二 进 制 数字 会 是 
10000000000000000000000000000000， (0x8000:0000)〉 ， 这 是 负数 ， 
因此 各 系统 会 把 时 间 误 解 作 1901 年 12 月 13 日 20 时 45 分 52 秒 〈 亦 有 说 回归 
到 1970 年 ) 。 这 时 可 能 会 令 软件 发 生 问 题 ， 导 致 系统 次 痪 。 


目前 的 解决 方案 是 把 系统 由 32 位 转 为 64 位 。 在 64 位 系统 下 ， 此 时 间 
最 多 可 以 表示 到 292，277，026，596 年 12 月 4 日 15 时 30 分 08 秒 。 


有 没有 对 人 友好 一 点 的 时 间 显 示 呢 ? 











。 ]ocaltime() 


>>> time.localtime() 
time.struct_time(tm year=2015, tm mon=5, tm_mday=4, tm_hour=21, tm_min=33, tm_sec=3 


这 个 就 友好 多 了 。 得 到 的 结果 可 以 称 之 为 时 间 元 组 〈 也 有 括号 ) ， 
其 各 项 的 含义 如 表 6-1 所 示 。 


表 6-1 时间 元 组 各 项 含义 








tm year 





tm mon 





tm mday 





tm _ hour 





tm min 





tm sec 





tm wday - 周 中 的 第 几 天 





th yday -年 中 的 第 几 天 


th isdst 夏令 时 














>>> t = time.localtime() 
>>> t[1] 
5 


通过 索引 能 够 得 到 相应 的 属性 ， 上 面 的 例子 中 吏 得 到 了 当前 时 间 的 
月 份 。 


其 实 ，time.localtime() 不 是 没有 参数 ， 它 在 默认 情况 下 ， 以 
time.time0 的 时 间 惟 为 参数 。 言 外 之 意 就 是 说 可 以 自己 输入 一 个 时 间 
惟 ， 返 回 那个 时 间 戳 所 对 应 的 时 间 《〈 按 照 公元 和 时 分 秒 计时 ) 。 例 如 : 


>>> time.localtime(100000) 
time.struct_time(tm year=1970, tm mon=1, tm_mday=2, tm_hour=11, tm_min=46, tm_sec=4 


。 gmtime() 


localtime() 得 到 的 是 本 地 时 间 ， 如 果 要 国际 化 ， 就 最 好 使 用 格林 威 
治 时 间 。 可 以 这 样 : 


>>> import time 
>>> time.gmtime() 
time.struct_time(tm year=2015, tm mon=5, tm_mday=4, tm_hour=23, tm_min=46, tm_sec=3 


格林 威 治标 准时 间 是 指 位 于 英国 伦 吝 郊区 的 旺 家 格林 威 治 天 文 台 的 
标准 时 间 ， 因 为 本 初子 午 线 被 定义 在 通过 那里 的 经 线 。 


还 有 更 友好 的 ， 请 继续 阅读 。 
e asctime() 


>>> time.asctime() 
'Mon May 4 21:46:13 2015 


time.asctimeO 的 参数 为 空 时 ， 默 认 是 以 time.localtime0O) 的 值 为 参数 ， 
所 以 得 到 的 是 当前 日 期 时 间 和 星期 。 当 然 ， 也 可 以 自己 设置 参数 : 


>>> h = time.localtime(1000000) 

>>> h 

time.struct_time(tm year=1970, tm mon=1, tm_mday=12, tm_hour=21, tm _min=46, tm_sec= 
>>> time.asctime(h 

'Mon Jan 12 21:46:40 1970' 


注意 ，time.asctime() 的 参数 必须 是 时 间 元 组 ， 类 似 上 面 那 种 。 若 不 
是 时 间 惟 ， 通 过 timetime0 得 到 的 时 间 蕉 也 可 以 转化 为 上 面 的 形式 。 


e ctimel() 


>>> time.ctime() 
'Mon May 4 21:52:22 2015 


在 没有 参数 的 时 候 ， 事 实 上 是 以 time.time() 的 时 间 截 为 参数 ， 也 可 
以 自 定义 一 个 时 间 截 。 


>>> time.ctime(1000000) 
'Mon Jan 12 21:46:40 1970' 


跟前 面 得 到 的 结果 是 一 样 的 ， 只 不 过 用 了 时 间 礁 作为 参数 。 


在 前 述 函数 中 ， 通 过 localtime0、gmtime0O 得 到 的 是 时 间 元 组 ， 
time0O 得 到 的 是 时 间 惟 。 有 的 函数 如 asctime0O 是 以 时 间 元 组 为 参数 ， 二 
如 ctimeO 是 以 时 间 戳 为 函数 ， 这 样 做 的 目的 是 为 了 满足 编程 中 多 样 化 的 


后 如 
需要 。 





。 mktime() 


mktime() 也 是 以 时 间 元 组 为 参数 ， 但 是 它 返 回 的 不 是 可 读 性 更 好 的 
那 种 样式 ， 而 是 : 


>>> lt = time. Localtime() 

>>> 1t 

time.struct_time(tm year=2015, tm mon=5, tm_mday=5, tm_hour=7, tm_min=55, tm_sec=29 
>>> time.mktime(1t) 

1430783729 .0 


返回 了 时 间 惟 ， 类 似 于 localtimeO 的 逆 过 程 〈localtimeO 是 以 时 间 戳 
为 参数 ) 。 


好 像 还 缺点 什么 ， 因 为 在 编程 中 ， 使 用 比较 多 的 是 "字符 串 ”， 似 乎 
还 没有 将 时 间 转 化 为 字符 串 的 函数 ， 这 个 应 该 有 。 





e strftimel() 
函数 格式 稍微 复杂 一 些 。 


Help on built-in function strftime in module time: 


strftime(...) strftime(format[, tuple]) -> string 


Convert a time tuple to a string according to a format Specification， 


将 时 间 元 组 按照 


See the 1 


间 定 格式 要 求 转 化 为 字符 串 。 如 来 不 指定 时 间 元 





组 ， 就 默认 为 localtime() 值 。 说 其 
东西 ， 如 表 6-2 所 示 。 


其 复杂 是 在 于 其 format， 


需要 用 到 下 面 的 


表 6-2 format 格 式 定义 


取 值 范围 (格式) 





世纪 的 年 份 


00 一 99， 如 “15?” 





完整 的 年 从 


如 “2015” 





萌 定 日 期 是 一 年 中 的 第 几 天 


001 一 366 





返回 月 份 


ES 到 





本 地 简化 月 份 的 名 称 


简写 英文 月 份 





本 地 完整 月 份 的 名 称 


完整 英文 月 份 








该 月 的 第 几 日 


如 5 月 1 日 返回 “01” 





该 日 的 第 几时 (24 小 时 制 ) 


00 一 23 





该 日 的 第 几时 〈12 小 时 制 ) 


gj 二 2 





分 名 


00~59 





秒 


0959 





在 该 年 中 的 第 多 少 星 期 〈 以 周 日 为 一 周 起 点 ) 


00 一 53 





同上 ， 只 不 过 是 以 周一 为 起 点 


00 一 53 





一 星期 中 的 第 几 天 


0 一 6 





时 区 


中 国 返 回 CST， 即 China Standard Time 





日 期 


日 /月 /年 





时 间 


时 :分 : 秒 





详细 日 期 时 间 


日 /月 /年 时 :分 : 秒 





“%” 字 答 








E 下 午 


简要 列举 如 下 : 


>>> time.Strftime("%y,%my%d") 
'15,05,05' 
>>> time.strftime("%y/%m/%d") 
'15/05/05" 


分 隔 符 可 以 自由 指定 ， 
不 逾 矩 > 了 。 


e Strptime() 








AM or PM 


死 然 已 经 变 成 字符 串 了 ， 就 可 以 "随心所欲 


Help on built-in function strptime in module time: 


strptime(... 


) strptime(string, format) -> struct_ time 


Parse a String to a time tuple according to a format Specification，See the 1ib 


strptime() 的 作用 是 将 字符 串 转 化 为 时 间 元 组 。 请 注意 ， 其 参数 要 指 
定 两 个 ， 一 个 是 时 间 字 符 串 ， 另 外 一 个 是 时 间 字 符 串 所 对 应 的 格式 ， 格 
式 符号 用 表 6-2 中 的 。 例 如 : 


>>> today = time.strftime("%y/%m/%d") 

>>> today 

"15/05/05 

>>> time.strptime(today, "%y/%m/%d") 

time.struct_time(tm year=2015, tm _ mon=5, tm_mday=5, tm_hour=0, tm_min=0, tm_sec=0, 


6.3.8 datetime 








虽然 time 模 块 已 经 能 够 把 有 关 时 间 方面 的 东西 搞定 了 ， 但 是 ， 有 时 
调用 起 来 感觉 不 是 很 直接 ， 于 是 又 出 来 了 一 个 datetime 模 块 ， 供 程序 员 
们 选择 使 用 。 


datetime 模 块 中 有 以 下 几 个 类 


datetime.date: 日 期 类 ， 第 用 的 属性 有 year/month/day。 
datetime.time: 有 时间 类 ， 常 用 的 有 hour/minute/second/microsecond。 
datetime.datetime: 日 期 时 间 类 。 

datetime.timedelta: 时 间 间 隔 ， 即 两 个 时 间 点 之 间 的 时 间 长 度 。 
datetime.tzinfo: 时 区 类 。 





1.date 类 
通过 实例 了 解 常 用 的 属性 : 


>>> import datetime 

>>> today = datetime.date.today() 
>>> today 

datetime.date(2015, 5, 5) 


其 实 这 里 生成 了 一 个 日 期 对 象 ， 然 后 操作 这 个 对 象 的 各 种 属性 。 用 
print 语 句 ， 可 以 使 视觉 更 佳 : 


>>> print today 

2015-05-05 

>>> print today.ctime() 

Tue May 5 00:00:00 2015 

>>> print today.timetuple() 

time.struct_time(tm year=2015, tm _ mon=5, tm_mday=5, tm_hour=0, tm_min=0, tm_sec=0, 
>>> print today.toordinal() 

735723 


特别 注意 ， 如 果 你 妄图 用 datetime.date.year0 是 会 报错 的 ， 因 为 year 
不 是 一 个 方法 ， 必 须 这 样 : 


>>> print today.year 
2015 

>>> print today.month 
5 

>>> print today.day 

5 


进一步 看 看 时 间 戳 与 格式 化 时 间 格 式 的 转换 : 


>>> to = today,toordinal() 

>>> 七 0 

735723 

>>> print datetime,date,.fromordinal(to) 
2015-05-05 


>>> import time 

>>> t = time.time() 

>>> t 

1430787994.80093 

>>> print datetime.date.fromtimestamp(t) 
2015-05-05 


还 可 以 更 灵活 一 些 ， 修 改 日 期 。 


>>> d1 = datetime.date(2015,5,1) 

>>> print d1 

2015-05-01 

>>> d2 = di.replace(year=2005, day=5) 
>>> print d2 

2005-05-05 


2.time 类 


也 要 生成 time 对 象 。 


>>> t = datetime.time(1,2,3) 


>>> print t 
01:02:03 


它 的 常用 属性 : 


>>> print t.hour 

1 

>>> print t.minute 
2 

>>> print t.second 
3 

>>> t.microsecond 
0 

>>> print t.tzinfo 
None 


3.timedelta 类 
主要 用 来 做 时 间 的 运算 。 比 如 : 


>>> now = datetime.datetime.now() 
>>> print now 
2015-05-05 09:22:43.142520 


没有 讲述 datetime 类 ， 因 为 在 有 了 date 和 time 类 知识 之 后 ， 这 个 类 比 
较 人 简单 。 我 最 喜欢 now 方 法 ， 对 now 增 加 5 个 小 时 : 





>>> b = now + datetime.timedelta(hours=5) 
>>> print b 
2015-05-05 14:22:43.142520 


增加 两 周 : 


>>> c = now + datetime.timedelta(weeks=2) 
>>> print c 
2015-05-19 09:22:43.142520 


计算 时 间 差 : 


>>>d=c-b 
>>> print d 
13 days, 19:00:00 


6.3.9 urllib 


urllib 模 块 用 于 读 取 来 自 网 上 【服务 器 上 ) 的 数据 ， 比 如 很 多 人 用 
Python 做 爬虫 程序 ， 就 可 以 使 用 这 个 模块 。 先 看 一 个 简单 例子 : 


>>> import urllib 
>>> itdiffer = urllib.urlopen("http://www.itdiffer.com") 


这 样 就 已 经 把 我 的 网 站 www.itdiffer.com 首 页 的 内 容 拿 过 来 了 ， 得 到 
了 一 个 类 似 文件 的 对 象 。 接 下 来 的 操作 跟 操作 一 个 文件 一 样 。 


>>> print itdiffer.read() 
<!DOCTYPE HTML> 
<html> 
<head> 
<title>I am Qiwsir</title> 


. ..// 因 为 内 容 太 多 ， 下 面 就 省 略 J 






































这 样 就 完成 了 对 网 页 的 一 个 抓 取 。 当 然 ， 如 果 你 真 的 要 做 爬虫 程 
序 ， 还 不 是 仅仅 如 此 。 这 里 不 介绍 爬虫 程序 如 何 编写 《关于 疏 虫 的 资 
料 ， 网 上 已 经 有 很 多 了 ， 读 者 可 以 搜索 并 学 习 ， 如 果实 在 理解 有 困难 ， 
“0 我 会 协助 你 的 ) ， 仅 说 明 urllib 模 块 的 常用 属性 和 方 
人 








>>> dir(urllib) 
['ContentTooShortError', 'FancyURLopener', 'MAXFTPCACHE', 'URLopener', ' all _' 


选 几 个 常用 的 介绍 ， 如 果 读 者 用 到 其 他 的 ， 可 以 通过 查看 文档 了 
。 


1.urlopen (url, data=None, proxies=None) 


urlopen0) 主 要 用 于 打开 url 文 件 ， 从 而 获得 指定 rl 网 页 内 容 ， 然 后 就 
如 同 操作 文件 那样 来 操作 。 


Help on function urlopen in module urllib: 


urlopen(url, data=None, proxies=None) Create a file-like object for the specifi 


得 到 的 对 象 被 叫 作 “ 类 文件 *， 从 和 名字 中 也 可 以 理解 后 面 的 操作 了 。 
先 对 参数 说 明 一 下 。 


url: 远程 数据 的 路 径 ， 第 第 是 网 址 。 
data: 如 果 使 用 post 方 式 ， 这 里 就 是 所 提交 的 数据 。 
proxies: 设置 代理 。 


关于 参数 的 详细 说 明 ， 还 可 以 参考 官方 文档 ， 这 里 仅 演 示 最 第 用 
如 前 面 的 例子 那样 。 


当 得 到 了 类 文件 对 象 之 后 ， 即 变量 itdiffer 引 用 了 得 到 的 类 文件 对 
这 个 对 象 依然 可 以 用 老 办 法 来 查看 它 的 属性 和 方法 。 





下 
< 修 








a 


>>> dir(itdiffer) 
oc init 


[ 一 d 


"iter ', '_ module ', '_repr_ ', 'close', 'code', 'fil 








从 结果 中 也 可 以 看 出 ， 这 个 类 文件 对 象 也 是 可 迭代 的 ， 下 面 是 比较 
常用 的 方法 。 


。 read()、readline()、readlines()、fileno()、cdloseO: 都 与 文件 操作 一 
样 ， 这 里 不 再 歼 述 。 

。 info(): 返回 头 信息 。 

。 getcode(): 返回 http 状 态 码 。 

。 geturl(): 返回 url。 


简单 举例 : 


>>> Itdiffer ,info() 

<httplib.HTTPMessage instance at 0xb6eb3f6c> 
>>> Itdiffer ,getcode() 

200 

>>> itdiffer.geturl() 
‘http://www.itdiffer.com' 





许多 时 候 ， 在 建立 了 类 文件 对 象 后 ， 要 通过 其 方法 得 到 杀 些 数据 。 


2. 对 ul 编码、 解码 


un 对 其 中 的 字符 有 严格 要 求 ， 不 许可 某 些 特 殊 字符 直接 使 用 某 些 字 
符 ， 比 如 un 中 有 空格 ， 会 自动 将 空格 进行 处 理 ， 这 个 过 程 需要 对 unl 进 





行 编码 和 解码 。 在 进行 web 开 发 的 时 候 要 特别 注意 这 里 。 
urllib 模 块 提供 了 url 编码 和 解码 功能 。 


quote (string[，safe]〉: 对 字符 串 进行 编码 。 参 数 safe 指 定 了 不 需 
要 编码 的 字符 。 
。 urllib.unquote (string〉: 对 字符 串 进 行 解码 。 
。 quote_plus (string[，safe]) : 与 urllib.quote 类 似 ， 但 这 个 方法 
用 “+” 来 蔡 换 空格 ， 而 quote 用 “%20” 来 代 蔡 空格 。 
。 unquote_plus (string) : 对 字符 串 进 行 解码 。 
。 urllib.urlencode (query[，doseq]) : 将 dict 或 者 包含 两 个 元 素 的 元 组 
列表 转换 成 ur 参数。 例如 {mname':laoqi，'age':40} 将 被 转换 
为 “name=laoqi&age=40”。 
。 pathname2url (path) : 将 本 地 路 径 转换 成 ur 路径。 
。 url2pathname (path) : 将 url 路 径 转 换 成 本 地 路 径 。 


看 例子 束 更 明白 了 : 





>>> du = "http://www.itdiffer.com/name=python book" 
>>> urllib.quote(du) 
'http%3A//www.itdiffer.com/name%3Dpython%20book' 

>>> urllib.quote_plus(du) 

'http%3A%2F%2Fwww. itdiffer.com%2Fname%3Dpython+book' 





注意 看 空格 的 变化 ， 一 个 被 编码 成 <9620”"， 另 外 一 个 是 “+”。 


再 看 解码 的 ， 假 如 在 Google 中 搜索 《 零 基础 学 Python》， 结 果 如 图 
6-5 所 示 。 





名 |) 号 https ww.google.com.sg/?gfe_rd=cr&ei=mjpIVaXzCdTFuASb_YC4CQ#q= 委 基础 +Pyt 


6 Qle 。 零 基础 python 


《 零 基础 学 Python》by qiwsir - GitHub 
https:// igithub Com/giwsir/ /BasicPython/ indexmd v Translate this page 

Nn 7, 2015 - This is for everyone. 零 基 础 学 Python. 第 零 部 分 省 上 高 楼 ， 望 民 天 涯 路 . 哎 
中 一 些 关于 python 的 事情 开始 本 栏 目的 原因 
重 回国 数 - 222.md - 223.md - 226.md 


( 零 基 础 学 习 Python、Python 入 门 ) 书籍 、 视 频 、 资 料 - GitHub 
TE igithub.com/Yixiaohan/codeparkshare ~ Translate this page 
5. 2015 - Python 初学 者 〈 和 零 基础 学 习 Python 、Python 入 门 ) 书 矫 、 视频、 资料 、 
社 区 推荐 . Contribute to codeparkshare development by creating an account 








图 6-5 ”在 Google 中 搜索 《 零 基 础 学 Python》 


与 本 书 同步 的 网 络 教程 在 这 次 搜索 中 排列 第 一 个 哦 。 
这 不 是 重点 ， 重 点 是 看 url， 它 就 是 用 “+” 蔡 代 空 格 。 





>>> dup = Urllib,quote_plus(du) 
>>> urllib.unquote_plus(dup) 
'http://www.itdiffer.com/name=python book' 


从 解码 效果 来 看 ， 是 比较 完美 的 逆 过 程 。 


>>> urllib.urlencode({"name":"qiwsir","web":"itdiffer.com"}) 
'web=itdiffer.com&name=qiwsir' 


如 果 将 来 你 要 做 一 个 网 站 ， 上 面 的 这 个 方法 或 许 会 用 到 的 。 


e urlretrieve() 








虽然 urlopen0) 能 够 建立 类 文件 对 象 ， 但 是 ， 不 等 于 将 远程 文件 保存 
在 本 地 存储 器 中 ，urlretrieve0 就 是 满足 这 个 需要 的 。 先 看 实例 : 


>>> import urllib 
>>> urllib.urlretrieve("http://www.itdiffer.com/images/me.jpg","me.jpg") 


('me.jpg', <httplib.HTTPMessage instance at 0xb6ecb6cc>) 
>>> 


me.jpg 是 一 张 存 在 于 服务 器 上 的 图 片 ， 地 址 是 : 
http://www.itdiffer.com/images/me.jpg， 把 它 保 存 到 本 地 存储 器 中 ， 并 且 
仍 命名 为 me.jpg。 注 意 ， 如 果 只 写 这 个 名 字 ， 表 示人 存在 局 动 Python 交互 
模式 的 那个 目录 中 ， 人 否则 ， 可 以 指定 存储 具体 目录 和 文件 名 。 


在 urllib 官 方 文档 中 有 一 大 段 相关 说 明 ， 读 者 可 以 去 认真 阅读 。 这 里 
仅 简 要 介绍 一 下 相关 参数 。 








urllib.urlretrieve(url[, filename[, reporthook[, datal]]]) 


。url: 文件 所 在 的 网 址 。 

。 filename: 可 选 。 将 文件 保存 到 本 地 的 文件 名 ， 如 果 不 指定 ，urllib 
会 生成 一 个 临时 文件 来 保存 。 

。 reporthook: 可 选 。 是 回调 函数 ， 当 链接 服务 器 和 相应 数据 传输 完 
毕 时 触发 本 函数 。 

。 data: 可 选 。 用 post 方 式 所 发 出 的 数据 。 


函数 执行 完毕 ， 返 回 的 结果 是 一 个 元 组 〈filename，headers) ， 
filename 是 保存 到 本 地 的 文件 名 ，headers 是 服务 器 啊 应 头 信息 。 





#!/UsSr/bin/env python 
# coding=utf-8 


import urllib 


def go(a, b, c): 
per = 100.0 *a*b/c 
if per > 100: 
per = 100 
print "%.2f%%" % per 


url = "http://youxi.66wz.com/uploads/1046/1321/11410192 .90d133701b06fOcc2826c3e5ac3 


local = "/home/qw/Pictures/g.jpg" 
urllib.urlretrieve(url, local, go) 


这 段 程序 融 是 要 下 载 指 定 的 图 片 ， 并 且 保 存 为 本 地 指定 位 置 的 文 
件 ， 同 时 要 显示 下 载 的 进度 。 上 述 文件 保存 之 后 执行 ， 显 示 如 下 效 末 : 








$ python 22501.py 
0 .00% 

8.13% 

16.26% 

24.40% 

32.53% 

40.66% 

48.79% 


56 .93% 
65 .06% 
73 .19% 
81.32% 
89 .46% 
97 .59% 
100 .00% 


到 相应 目录 中 查看 ， 能 看 到 与 网 上 地 址 一 样 的 文件 。 这 里 就 不 对 结 
果 截 图 了 ， 读 者 自行 查看 (或 许 在 本 书 出 版 的 时 候 ， 这 张 神秘 的 图 片 你 
己 经 看 不 到 了 ， 你 应 该 把 这 视 为 正 第 的 事情 ， 那 么 你 束 换 一 张 图 片 地 址 
吧 ) 。 








6.3.10 urllib2 





urllib2 是 另外 一 个 模块 ， 它 跟 urllib 有 相似 的 地 方 一 一 都 是 对 url 相 关 
的 操作 ， 也 有 不 同 的 地 方 。 


有 时 候 两 个 要 同时 使 用 ，urllib 模 块 和 urllib2 模 块 有 的 方法 可 以 相互 
替代 ， 有 的 不 能 。 看 下 面 的 属性 方法 列表 就 知道 了 。 





>>> dir(urllib2) 
['AbstractBasicAuthHandler', 'AbstractDigestAuthHandler', 'AbstractHTTPHandler', 'B 


读者 不 妨 将 urllib 和 urllib2 的 方法 属性 名 称 进行 比较 ， 会 发 现 它们 之 
间 有 一 部 分 是 相同 的 ， 比 如 urlopen0 跟 urllib.openg0) 非 常 类 似 ， 除 了 相同 
的 就 是 不 同 的 了 。 


Request 类 


在 前 面 引 用 的 内 容 中 就 明确 指出 ， 利 用 urllib2 模 块 可 以 建立 一 个 
Request 对 象 ， 建 六 Request 对 象 的 方法 就 是 使 用 Request 类 。 


>>> req = urllib2.Request("http://www.itdiffer.com") 





建立 了 Request 对 象 之 后 ， 它 的 最 直接 应 用 可 以 作为 urlopen0) 方 法 的 
参数 。 


2 


>>> response = UrlLlib2.uUrlopen(req) 
>>> page = response.read() 
>>> print page 


因为 与 前 面 的 urllib.open〈"http://wwwi.itdiffer.com") 结果 一 样 ， 就 
不 再 闭 述 


但 是 ， 如 果 Request 对 象 仅仅 局 限于 此 ， 似 乎 还 没有 什么 太 大 的 优 
势 。 因 为 刚才 的 访问 仅仅 满足 以 get 方 式 请 求 页 面 ， 并 建立 类 文件 对 
象 。 如 果 是 通过 post 同 某 地 址 提交 数据 ， 也 可 以 建 六 Request 对 象 。 





import urllib 
import urllib2 


Url = 'http://www.itdiffer.com/register.py' 





Values = {'name' : 'qiwsir'"， 
'Jocation' : 'China', 
'language' : 'Python' } 
data = urllib.urlencode(values) 
req = urllib2.Request(url, data) # 发 送 请 求 同 时 传 
data 表 单 
response = urllib2.urlopen(req) # 接 受 反 馈 的 信息 





the_page = response.read() 


# 读 取 反 馈 的 内 容 


如 果 读 者 照抄 上 面 的 程序 ， 然 后 运行 代码 ， 肯 定 是 报错 的 ， 因 为 那 
个 ul 中 没有 相应 的 接受 客户 端 post 上 去 的 data 的 程序 文件 ， 为 了 让 程序 
运行 ， 读 者 可 以 开发 接收 数据 的 程序 。 上 面 的 代码 只 是 以 一 个 例子 来 显 
ee 个 用 途 ， 并 且 在 这 个 例子 中 以 post 方 式 提 交 数 


在 网 站 中 ， 有 的 会 通过 User-Agent 来 判断 访问 者 是 浏览 器 还 是 别 的 
程序 ， 如 果 通 过 别 的 程序 访问 ， 它 有 可 能 拒绝 。 这 时 候 我 们 编写 程序 去 
访问 ， 就 要 设置 headers 了 。 设 置 方法 是 : 


USer_agent = 'Mozilla/4.0 (compatible; MSIE 5.5; Windows NT) 
headers = { 'User-Agent' : User_agent } 


然后 重新 建立 Request 对 象 : 


req = urllib2.Request(url, data, headers) 


再 用 urlopen() 方 法 访问 : 


response = urllib2.urlopen(req) 





除了 上 面 的 演示 之 外 ，urllib2 模 块 的 东西 还 有 很 多 ， 比 如 还 可 以 : 


设置 HTTP Proxy 
设置 Timeout 值 
自动 redirect 
处 理 cookie 


人 > 内 容 不 再 一 一 介绍 ， 当 需要 用 到 的 时 候 可 以 查看 文档 或 者 去 网 





6.3.11 XML 


XML 在 软件 领域 用 途 非 常 广 演 ， 有 名 人 日 : 

“ 当 XML 〈 扩 展 标记 语言 ) 于 1998 年 2 月 被 引入 软件 工业 界 时 ， 它 给 
整个 行业 这 来 了 一 场 风 暴 。 有 史 以 来 第 一 次 ， 这 个 世界 拥有 了 一 种 用 来 
结构 化 文档 和 数据 的 通用 且 适 应 性 强 的 格式 ， 它 不 仅仅 可 以 用 于 Web， 
而 且 可 以 被 用 于 任何 地 方 。” 

一 一 《Designing With Web Standards Second Edition》 , Jeffrey Zeldman 


如 果 要 对 XML 做 一 个 定义 式 的 说 明 ， 束 不 得 不 引用 w3school 里 面 简 
洁 而 明快 的 说 明 : 


。 XML 指 可 扩展 标记 语言 (EXtensible Markup Language) 。 
。 XML 是 一 种 标记 语言 ， 很 类 似 于 HTML。 





中 ， 
然 支持 。 





XML 的 设计 宗旨 是 传输 数据 ， 而 非 显示 数据 。 
XML 标签 没有 被 预定 义 ， 你 需要 自行 定义 标签 。 
XML 被 设计 为 具有 目 我 描述 性 。 

XML 是 wW3C 的 推荐 标准 。 


如 果 读 者 要 详细 了 解 和 学 习 XML， 可 以 阅读 w3school 的 教程 。 


XML 的 重要 在 于 它 是 用 来 传输 数据 的 ， 因 此 ， 特 别 是 在 web 编程 
经 党 要 用 到 。 有 了 它 让 数据 传输 变 得 简单 了 ， 这 人 么 重要 ，Python 当 








般 来 讲 ， 一 个 引 人 关 注 的 东西 ， 总 会 有 很 多 人 从 不 同 侧面 去 关 


注 。 在 编程 语言 中 也 是 如 此 ， 所 以 ， 对 XML 这 个 明星 似 的 东西 ，Python 
提供 了 多 种 模块 来 处 理 。 


xml.dom.* 模 块 : Document Object Model。 适 合用 于 处 理 DOM 
API。 它 能 够 将 XML 数 据 在 内 存 中 解析 成 一 -要 然后 通过 对 树 的 
操作 来 操作 XML， 但 是 ， 由 于 这 种 方式 将 XML 数据 映射 到 内 存 中 
的 树 ， 导 致 比较 慢 ， 且 消耗 更 多 内 存 。 

xml.sax.* 模 块 : simple API for XML 。 由 于 SAX 以 流 式 读 取 XML 文 
件 ， 从 而 速度 较 快 ， 且 少 占用 内 存 ， 但 是 操作 上 稍 复杂 ， 需 要 用 户 
实现 回调 函数 。 

xml.parser.expat: 是 一 个 直接 的 ， 低 级 一 点 的 基于 C 的 expat 的 语法 
分 析 器 。expat 接 口 基 于 事件 有 反馈， 有 点 像 SAX 但 又 不 太 像 ， 因 为 它 
的 接口 并 不 是 完全 规范 于 expat 库 的 。 

xml.etree.ElementTree 〈 以 下 简称 ET) : 元 素 树 。 它 提供 了 轻 量 级 
的 Python 式 的 API， 相 对 于 DOM，ET 快 了 很 多 ， 而 且 有 很 多 令 人 和 愉 
悦 的 API 可 以 使 用 ， 相 对 于 SAX，ET 也 有 ET.iterparse 提 供 了 “在 空 
中 ”的 处 理 方 式 ， 没 有 必要 加 载 整个 文档 到 内 存 ， 节 省 内 存 。ET 性 
je 但 是 API 的 效率 更 高 一 点 而 且 使 用 起 来 
很 方便 。 


所 以 ， 我 用 xml.etree.ElementTree。 


ElementTree 在 标准 库 中 有 两 种 实现 ， 一 种 是 纯 Python 实 现 : 








xml.etree.ElementTree， 另 外 一 种 是 : xml.etree.cElementTree。 


如 果 读 者 使 用 的 是 Python 2.x， 可 以 像 这 样 引入 模块 : 


try: 

import xml.etree.cElementTree as ET 
except ImportError: 

Import xml.etree.ElementTree as ET 





如 果 是 Python 3.3 以 上 ， 就 没有 这 个 必要 了 ， 只 需要 一 句 话 import 
xml.etree.ElementTree as ET 即 可 ， 然 后 由 模块 自动 来 寻找 适合 的 方式 。 
显然 Python 3.x 相 对 Python 2.x 有 了 很 大 进步 。 

1. 裔 历 查 询 

先 要 做 一 个 XML 文档 ， 用 w3school 中 的 一 个 例子 ， 如 图 6-6 所 示 。 


这 是 一 个 XML 树 ， 只 不 过 是 用 图 来 表示 的 ， 先 把 这 标 树 写成 XML 
文档 格式 。 





<bookstore> 

<book category="COOKING"> 
<title lang="en">Everyday Italian</title> 
<author>Giada De Laurentiis</author> 
<year>2005</year> 
<price>30.00</price> 

</book> 

<book category="CHILDREN"> 
<title lang="en">Harry Potter</title> 
<author>J K. Rowling</author> 
<year>2005</year> 
<price>29.99</price> 

</book> 
<book category="WEB"> 
<title lang="en">Learning XML</title> 
<author>Erik T. Ray</author> 
<year>2003</year> 
<price>39.95</price> 

</book> 

</bookstore> 


根 苑 素 
<bookstore> 











属性 : | 


“category” 


元 素 : 元 素 : 
过 YEar> <price» 









文本 : 
Harry Potter 


文本 : 
] kK, Rowling 


图 6-6 XML 树 


将 XML 保 存 为 名 为 22601.xml 的 文件 ， 接 下 来 束 是 以 它 为 对 象 ， 练 
习 各 种 招数 了 。 












>>> import xml.etree.cElementTree as ET 





为 了 简化 ， 用 这 种 方式 引入 ， 在 编程 实践 中 推荐 读者 使 用 
try...except... 方 式 。 


>>> tree = ET.ElementTree(file="22601.xml") 
>>> tree 
<ElementTree object at Oxb724cc2c> 


建立 起 XML 人 解析 树 ， 然 后 通过 根 节 点 加 下 开始 读 取 各 个 元 素 
(Celement 对 象 ) 。 


在 上 述 XML 文 档 中 ， 根 元 素 是 bookstore， 它 没有 属性 ， 或 者 属性 为 


二 


>>> root = tree.getroot() # 获 得 根 


>>> root.tag 
"bookstore' 
>>> root ,attrib 


{} 





要 想 将 根 下面 的 元 素 都 读 出 来 ， 可 以 : 


>>> for child in root: 
print child.tag，child.attrib 


book {'category ': 'COOKING'} 
book {'category ': " CHILDREN '} 
book {'category ': 'WEB'} 





也 可 以 用 下 面 方法 读 取 指定 元 系 的 信息 : 


>>> root[0].tag 

'book' 

>>> root[0].attrib 

{'category': 'COOKING'} 

>>> root[9] .text # 无 内 容 


Kk | 
再 深入 一 层 ， 就 有 内 容 了 : 


>>> root[0][0].tag 

"二 it]le' 

>>> root[0][0].attrib 
{'lang': "en' 

>>> root[0][0].text 
'Everyday Italian' 





对 于 ElementTree 对 象 ， 有 一 个 iter 方 法 可 以 对 指定 名 称 的 子 节 点 进 
行 深 度 优 先 遍历 。 例 如 : 


>>> for ele in tree.iter(tag="book"): # 遍 历 名 称 为 


book 的 节点 


print ele.tag, ele.attrib 
book f{'category': 'COOKING'} 
book {'category': 'CHILDREN'} 
book {'category': 'WEB'} 


>>> for ele in tree.iter(tag="title"): # 遍 历 名 称 为 


title 的 节点 


print ele.tag, ele.attrib, ele.text 


title {'lang': 'en'} Everyday Italian 
title {'lang': 'en'} Harry Potter 
title {'lang': 'en'} Learning XML 





如 琳 不 指定 元 素 名 称 ， 就 是 将 所 有 的 元 素 授 历 一 所。 


>>> for ele in tree.iter(): 
print ele.tag, ele.attrib 


bookstore {} 

book {'category': 'COOKING'} 
title {'lang': 'en'} 

author {3} 

year {} 

price {} 

book {'category': 'CHILDREN'} 
title {'lang': 'en'} 

author {3} 

year {} 

price {} 

book {'category': 'WEB'} 
title {'lang': 'en'} 

author {} 

year {} 

price {} 


除了 上 面 的 方法 ， 还 可 以 通过 路 径 搜 索 到 指定 的 元 素 ， 读 取 其 内 
容 ， 这 就 是 xzpath。 此 处 对 xpath 不 详解 ， 如 果 要 了 解 可 以 到 网 上 搜索 有 
天 人 信息。 


>>> for ele in tree.iterfind("book/title"): 
print ele.text 


Everyday Italian 
Harry Potter 
Learning XML 


利用 findall0 方 法 ， 也 可 以 实现 查找 功能 : 


>>> for ele in tree.findall("book"): 
title ele.find('title').text 
price ele.find('price').text 
lang = ele.find('title').attrib 
print title, price, lang 


Everyday Italian 30.00 {'lang': 'en'} 
Harry Potter 29.99 {'lang': 'en'} 
Learning XML 39.95 {'lang': 'en'} 


2. 编 辑 


除了 读 取 有 关 数 据 之 外 ， 还 能 对 XML 进行 编辑 ， 即 增 、 删 、 改 、 
查 功 能 ， 还 是 以 上 面 的 XML 文档 为 例 : 


>>> root[1].tag 

"book 

>>> del root[1] 

>>> for ele in root: 
print ele.tag 


如 此 ， 成 功 删除 了 一 个 节点 ， 原 来 有 三 个 book 节 点 ， 现 在 就 还 剩 两 
个 了 。 打 开源 文件 再 看 看 ， 是 不 是 正好 少 了 第 二 个 节点 呢 ? 一 定 很 让 你 
失望 ， 源 文件 居然 没有 变化 。 


的 确 如 此 ， 源 文件 没有 变化 ， 因 为 至 此 的 修改 动作 ， 还 停留 在 内 存 
中 ， 还 没有 将 修改 结果 输出 到 文件 。 不 要 和 态 记 ， 我 们 是 在 内 存 中 建立 的 
ElementTree 对 象 。 再 这 样 做 : 











>>> import os 
>>> outpath = os.getcwd() 
>>> file = Outpath + "/22601.xm]l" 


把 当前 文件 路 径 拼 装 好 。 然 后 : 
>>> tree.write(file) 
再 看 源 文件 ， 已 经 变 成 两 个 节点 了 。 
除了 删除 ， 也 能 够 修改 : 
>>> for price in root,iter("price"): # 原 来 每 本 书 的 价格 
print price.text 
30.00 
39.95 


>>> for price in root.iter("price"): # 每 本 上 涨 


7 元 ， 并 且 增 加 属性 标记 


new_price = float(price.text) + 7 
price.text = Str(new_price) 
price.set("updated", "up") 


>>> tree.write(file) 


查看 源 文件 : 


<bookstore> 
<book category="COOKING"> 
<title lang="en">Everyday Italian</title> 
<author>Giada De Laurentiis</author> 


<year>2005</year> 
<price updated="up">37.0</price> 
</book> 


<book category="WEB"> 
<title lang="en">Learning XML</title> 
<author>Erik T. Ray</author> 


<year>2003</year> 
<price updated="up">46.95</price> 
</book> 
</bookstore> 


不 仅 价 格 修改 了 ， 而 且 在 price 标 签 里 面 增加 了 属性 标记 。 


上 面 用 del 来 删除 某 个 元 素 ， 其 实 ， 在 编程 中 用 的 不 多 ， 较 多 使 用 
remove() 方 法 。 比 如 要 删除 price>40 的 书 。 可 以 这 么 做 : 


>>> for book in root.findall("book"): 
price = book.find("price").text 
if float(price) > 40.0: 
root.remove(book) 


>>> tree.write(file) 
于 是 就 这 样 了 : 


<bookstore> 
<book category="COOKING"> 
<title lang="en">Everyday Italian</title> 
<author>Giada De Laurentiis</author> 


<year>2005</year> 
<price updated="up">37.0</price> 
</book> 
</bookstore> 


接 下 来 就 要 增加 元 素 了。 


>>> import xml.etree.cElementTree as ET 
>>> tree = ET.ElementTree(file="22601.xml") 


>>> root = tree.getroot() 
>>> ET.SubElement(root, "book") # 在 

















root 里 面 添加 





book 节 点 


<Element "book' at 0xb71c7578> 
>>> for ele in root: 
print ele.tag 


book 


book 

>>> b2 = root[i1] # 得 到 新 增 的 
book 节 点 

>>> b2.text = "python" # 添 加 内 容 


>>> tree.write("22601.xml") 


查看 源 文件 : 


<bookstore> 
<book category="COOKING"> 
<title lang="en">Everyday Italian</title> 
<author>Giada De Laurentiis</author> 
<year>2005</year> 
<price updated="up">37.0</price> 
</book> 
<book>python</book> 
</bookstore> 





3. 常 用 属性 和 方法 总 结 
ET 里 面 的 属性 和 方法 不 少 ， 这 里 列 出 常用 的 ， 供 使 用 中 备查 。 
(1) Element 对 象 
常用 属性 如 下 。 
。 tag: string， 元 素数 据 种 类 。 


text: string， 元 素 的 内 容 。 
attrib: dictionary， 元 素 的 属性 字 — 典 。 
tail: string， 元 素 的 尾 形 。 


针对 属性 的 操作 如 下 。 


clear(): 清空 元 素 的 后 代 、 属 性 、text 和 tail 也 设置 为 None。 

get (key，default=None) : 获取 key 对 应 的 属性 值 ， 如 该 属性 不 存 
在 则 返回 default 值 。 

items(): 根据 属性 字典 返回 一 个 列表 ， 列 表 元 素 为 (key， 

value) 。 

keys(): 返回 包含 所 有 元 素 属 性 键 的 列表 。 

set (key，value) : 设置 新 的 属性 键 与 值 。 


针对 后 代 的 操作 如 下 。 


append 〈subelement) : 添加 直系 子 元 素 。 

extend (subelements) : 增加 一 串 元 素 对 象 作为 子 元 素 。 

find (match) : 寻找 第 一 个 匹配 子 元 素 ，[ 匹 配对 象 可 以 为 tag 或 
path 。 

findall Cmatch) : 寻找 所 有 匹配 子 元 素 ， 匹 配对 象 可 以 为 tag 或 
path 。 

findtext (match): 寻找 第 一 个 匹配 子 元 素 ， 返 回 其 text 值 。 匹 配对 
象 可 以 为 tag 或 path。 

insert (index，element) : 在 指定 位 置 插 入 子 元 素 。 

iter (tag=None) : 生成 表 历 当前 元 素 所 有 后 代 或 者 给 定 tag 的 后 代 
的 迭代 器 。 

iterfind (match) : 根据 tag 或 path 查 找 所 有 的 后 代 。 

itertext(): 裔 历 所 有 后 代 并 返回 text 值 。 

remove (subelement) : 删除 子 元 素 。 














(2) ElementTree 对 象 


find (match) 。 

findall (match) 。 

findtext (match, default=None) 。 
getroot(): 获取 根 节 点 。 

iter (tag=None) 。 


e iterfind (match) 。 

。 parse (source，parser=None) : 装载 xml 对 象 ，source 可 以 为 文件 名 
或 文件 类 型 对 象 。 

。 Write (file, encoding="us-ascii", xml_declaration=None, 
default_namespace=None, method="xml") 。 





6.3.12 JSON 


就 传递 数据 而 言 ，XML 是 一 种 选择 ， 还 有 男 外 一 种 一 一 JSON， 它 
是 一 种 轻 量 级 的 数据 交换 格式 ， 如 果 读 者 要 做 Web 编 程 ， 则 会 用 到 它 。 
根据 维基 百科 的 相关 内 容 ， 对 JSON 了 解 一 下 : 


JSON (JavaScript Object Notation ) 是 一 种 由 道格拉斯 : 克 罗 克 福特 
构想 设计 、 轻 量 级 的 数据 交换 语言 ， 以 文字 为 基础 ， 且 易于 让 人 阅读 。 
尽管 JSJON 是 JavaScript 的 一 个 子 集 ， 但 JSON 是 独立 于 语言 的 文本 格式 ， 
并 且 采 用 了 类 似 于 C 语 言 家 族 的 一 些 习 惯 。 


关于 JSON 更 为 详细 的 内 容 ， 可 以 参考 网 站 : http://www.json.org。 
从 上 述 网 站 摘 取 部 分 内 容 ， 了 解 一 人 JSON 的 结构 。 
JSON 建 构 于 两 种 结构 : 


“名 称 / 值 ? 对 的 集合 (A collection of name/value pairs) ， 不 同 的 语 
言 中 ， 它 被 理解 为 对 象 (object) 、 纪 录 (record) 、 结 构 
(struct) 、 字 典 〈dictionary) 、 哈 希 表 (hash table) 、 有 键 列 表 
(keyed list) 或 者 关联 数组 〈associative array) 。 
值 的 有 序列 表 (An ordered list of values) ， 在 大 部 分 语言 中 ， 它 被 
理解 为 数组 (array) 。 


Python 标准 库 中 有 JSON 模 块 ， 主 要 执行 序列 化 和 反 序 列 化 功能 。 
序列 化 : encoding， 把 一 个 Python 对 象 编码 转化 成 JSON 字 符 串 。 


decoding， 把 JSON 格 式 字符 串 解码 转换 为 Python 数据 对 





1. 基 本 操作 
JSON 模 块 相对 XML 单纯 了 很 多 : 


>>> import json 
>>> json. all _ 
['dump', 'dumps', "load'， 'loads', 'JSONDecoder', 'JSONEncoder'] 


e encoding: dumps() 


>>> data = [{"name":"qiwsir", "lang":("python", "english"), "age":40}] 
>>> print data 


[{'lang': ('python', 'english'), 'age': 40, 'name': 'gqiwsir'}] 
>>> data_json = json.dumps(data) 
>>> print data_ json 


[{"lang": ["python", "english"], "age": 40, "name": "qiwsir"}] 


encoding 的 操作 是 比较 简单 的 ， 请 注意 观察 data 和 data_json 的 不 同 
lang 的 值 从 元 组 变 成 了 列表 ， 还 有 不 同 : 





>>> type(data_json) 
<type 'str'> 

>>> type(datal) 
<type 'list'> 


e decoding: loads() 
decoding 的 过 程 也 像 上 面 一 样 简 单 : 


>>> new_data = json.loads(data json) 
>>> new_data 


[{u'lang': [u'python', u'english'], u'age': 40, u'name': Uu'giwsir'}] 
需要 注意 的 是 ， 解 码 之 后 并 没有 将 元 组 还 原 。 
上 面 的 data 孝 不 是 很 长 ， 还 能 凑合 阅读 ， 如 宋 很 长 了 了， 阅读 就 有 难 


度 了 。 所 以 ，JSON 的 dumpsO 提 供 了 可 选 参数 ， 利 用 它们 能 在 输出 上 对 
人 更 友好 〈 这 对 机 器 是 无 所 谓 的 ) 。 


>>> data j = json.dumps(data, sort_keys=True, indent=2) 
>>> print data j 


"age": 40, 
"lang": [ 


"python" 
"english" 
], 
"name": "qiwsir" 
} 
] 





sort_keys=True 意 思 是 按照 键 的 字典 顺序 排序 ，indent=2 是 让 每 个 键 / 
值 对 显示 的 时 候 ， 以 缩 进 两 个 字符 对 齐 ， 这 样 的 视觉 效果 好 多 了 。 


2. 大 JSON 字 符 串 


如 果 数 据 不 是 很 大 ， 那 么 上 面 的 操作 足够 了 ， 但 现在 是 “大 数据 "时 
代 了 ， 随 便 一 个 什么 业务 都 在 说 自己 是 大 数据 ， 显 然 不 能 总 让 JSON 很 
小 。 前 面 的 操作 方法 是 将 数据 都 读 入 内 存 ， 如 果 数 据 量 太 大 了 内 存 会 爆 
满 ， 这 肯定 是 不 行 的 。 怎 么 办 ? JSON 提供 了 load0 函 数 和 dump0) 函 数 解 
决 这 个 问题 ， 注 意 ， 跟 已 经 用 过 的 函数 相 比 是 不 同 的 ， 请 仔细 观 容 。 











>>> import tempfile # 临 时 文件 模块 


>>> data 

[{'lang': ('python', 'english'), 'age': 40, 'name': 'qiwsir'}] 
>>> f = tempfile.NamedTemporaryFile(mode='w+') 

>>> json.dump(data, f) 

>>> f.flush() 

>>> print open(f.name, "r").read() 

[{"lang": ["python", "english"], "age": 40, "name": "qiwsir"}] 


6.4 第 三 方 库 


标准 库 的 内 容 已 经 非常 多 了 ， 前 面 仅仅 列举 几 个 ， 但 是 Python 给 编 
程 者 的 文 持 不 仅仅 在 于 标准 库 ， 还 有 不 可 胜 数 的 第 三 方 库 。 因 此 ， 作 为 
一 个 Pythoner， 即 使 你 达到 了 master 的 水 平 ， 在 做 某 个 事情 之 前 最 好 在 
网 上 搜索 一 下 是 否 有 标准 库 或 者 第 三 方 库 能 蔡 你 完成 。 因 为 ， 伟 大 的 艾 
人 牛顿 事 士 说 过 : 如 有 果 我 比 别人 看 得 更 远 ， 那 是 因为 我 站 在 巨人 的 
衣 上 。 


编程 束 更 要 站 在 巨人 的 肩 上 ， 标 准 库 和 第 三 方 库 以 及 其 提供 者 就 是 
巨人 ， 我 们 本 应 当 谦 插 地 回 其 学 习 ， 并 应 用 其 成 果 。 














6.4.1 安装 第 三 方 库 





安 闭 第 三 方 库 的 方法 有 几 种 ， 不 同方 法 有 不 同 的 优 缺 点 ， 读 者 可 以 
根据 自己 的 喜好 或 者 实际 的 工作 情景 来 选择 使 用 。 





方法 一 : 利用 源码 安装 


在 github.com 网 站 可 以 下 载 第 三 方 库 的 源码 〈 注 意 ，github 不 是 源码 
的 唯一 来 源 ， 只 不 过 很 多 源码 都 在 这 个 网 站 上 ， 我 也 喜欢 罢了 ) ， 得 到 
源码 之 后 ， 在 本 地 安装 。 


如 果 你 :下 载 的 是 一 个 文件 包 ， 即 得 到 的 源码 格式 为 zip 或 tar.zip 或 
tar.bz2 的 压缩 文件 ， 需 要 先 解 压缩 ， 然 后 进入 其 目录 《文件 夹 ) ;如果 
你 能 熟练 使 用 git 命 令 ， 可 以 直接 从 github 中 clone 源 码 到 本 地 计算 机 上 ， 
然后 再 进入 该 目录 (文件 来) 。 进 去 之 后 通常 会 看 见 setup.py 文 件 。 如 
果 是 Linux 操 作 系 统 或 者 苹果 计算 机 (我 是 用 Ubuntu 系 统 ， 特 别 推荐 
哦 ) ， 束 在 这 里 运行 shell， 执 行 命令 : 





python setup.py install 


如 果 用 的 是 windows 系 统 ， 需 要 打开 命令 行 模式 ， 执 行 上 述 指令 即 


如 此 ， 就 能 把 这 个 第 三 库 安装 到 系统 里 。 具 体位 置 ， 要 视 操 作 系 统 
和 你 当初 安装 Python 环境 时 设置 的 路 径 而 定 。 默 认 条 件 下 ，Windows 是 
在 C:\Python2.7\Lib\site-packages，Linux 在 /usr/local/lib/python2.7/dist- 
packages 《这 个 只 是 参考 ， 不 同 发 行 版 会 有 差别 ， 具 体 请 读者 根据 自己 
的 操作 系统 找 找 ) ，Mac 在 /Library/Python/2.7/site-packages。 


这 种 安装 的 方法 有 时 候 厅 烦 一 些 ， 但 是 比较 灵活 ， 主 要 体现 在 : 


。 可 以 下 载 安 装 上 自己 选 定 的 任意 版 本 的 第 三 方 库 ， 比 如 最 新 版 ， 或 者 
更 早 的 杀 个 版 本 ， 所 以 在 某 些 有 特殊 需要 的 时 候 ， 常 党 使 用 这 种 方 
式 安 装 第 三 方 库 。 

。 通过 安 朔 设置 可 以 指定 安装 目录 ， 目 由 度 比 较 高 。 


有 安装 就 要 有 弛 载 ， 凶 载 所 安装 的 库 非常 简单 ， 只 需要 到 相应 系统 
的 site-packages 目 录 ， 直 接 删 挥 库 文件 即 可 。 

















方 淡 二 : pip 安 装 
用 源码 安装 ， 不 是 我 推荐 的 ， 我 推荐 的 是 用 第 三 方 库 的 省 理工 具 安 
装 。 








有 一 个 网 站 专门 用 来 存储 第 三 方 库 ， 在 这 个 网 站 上 的 所 有 软件 包 ， 
都 能 用 pip 或 者 easy_install 这 种 安装 工具 来 安装 ， 网 站 的 地 址 : 
https://pypi.python.org/pypi。 


pip 是 一 个 以 Python 计算 机 程序 语言 写成 的 软件 包 管 理 系统 ， 可 以 安 
装 和 管理 软件 包 ， 另 外 很 多 软件 包 也 可 以 在 “Python 软件 包 索 引 ”( 责 
语 : Python Package Index， 简 称 PyPI) 中 找到 。 ( 源 自 《 维 其 百科 》) 


首先 ， 要 安装 pip。 如 果 读 者 跟 我 一 样 ， 用 的 是 Ubuntu 系统 或 者 其 
他 某 种 Linux 系 统 ， 束 用 不 到 这 个 操作 ， 因 为 在 安装 操作 系统 的 时 候 已 
如 果 因 为 什么 原因 而 没有 安装 ， 可 以 使 用 
[下 方法 : 





e。 Debian and Ubuntu : 


sudo apt-get install python-pip 


e Fedora and CentOS: 


sudo yum install python-pip 


当然 ， 也 可 以 下 载 文 件 get-pip.py， 然 后 执行 python get-pip.py 来 安 
装 ， 下 载 地 址 是 : https://bootstrap.pypa.io/get-pip.py。 这 个 方法 也 适用 于 
Windows 系 统 。 


对 于 Windows 操 作 系统 ， 如 果 你 安装 了 某 个 版 本 的 Python， 特 别 注 
意 到 安装 目录 中 找 一 找 ， 一 般 情 况 下 pip 就 已 经 默认 安装 好 了 。 
pip 就 这样 安装 好 了 ， 非 党 简单 吧 。 


然后 你 就 可 以 淋漓 尽 致 地 安装 第 三 方 库 了 ， 之 所 以 那么 痛快 ， 是 因 
为 只 需要 执行 pip install XXXXXX (XXXXXX 代 表 第 三 方 库 的 名 字 ) 即 
可 。 








如 


第 三 方 库 安 装 完 毕 。 








6.4.2 ”以 requests 为 例 


以 requests 模 块 为 例 来 说 明 第 三 方 库 的 安装 和 使 用 。 之 所 以 选 这 
个 ， 是 因为 前 面 介 绍 了 urllib 和 urllib2 两 个 标准 库 的 模块 ， 与 之 有 类 似 功 
能 的 第 三 方 库 中 requests 也 是 一 个 用 于 在 程序 中 进行 http 协 议 下 的 get 和 
post 请 求 的 模块 ， 并 且 被 网 友 说 成 “好 用 的 要 器”。 


说 明 : 下 面 的 内 容 是 根据 网 友 1world0x00 提 供 的 文章 修改 而 成 的 ， 
对 她 表示 万 分 感激 。 








1 安装 


pip install requests 


安 闭 好 之 后 ， 在 交互 模式 下 : 


>>> import requests 
>>> dir(requests) 
['ConnectionError', 'HTTPError', ‘'NullHandler', 'PreparedRequest', 'Request', 'Requ 


从 上 面 的 列表 中 可 以 看 出 ， 在 http 中 常用 到 的 get、cookies、post 等 
都 赫然 在 目 。 

2.get 请 求 

>>> r = requests.get("http://www.itdiffer.com") 

得 到 一 个 请 求 的 实例 ， 然 后 : 


>>> r.cookies 
<<class 'requests.cookies.RequestsCookieJar'>[]> 





这 个 网 站 对 客户 端 没 有 写 任 何 cookies 内 容 ， 换 一 个 看 看 : 


>>> r = requests.get("http://www.1worldOx00.com") 
>>> r.cookies 
<<class 'requests.cookies.RequestsCookieJar'>[Cookie(version=0, name="'PHPSESSID', Vv 


仔细 观察 ， 是 不 是 看 到 了 cookie 的 name 和 value， 结 合 对 网 络 有 关 知 
识 的 了 解 ， 是 不 是 有 一 种 齿 然 开明 习 然 大 悟 的 感觉 ? 


继续 ， 还 有 别 的 属性 可 以 看 看 : 





>>> r.headers 
{'x-powered-by': 'PHP/5.3.3', 'transfer-encoding': 'chunked', 'set-cookie': "PHPSES 


>>> r.encoding 
'UTF-8"' 


>>> r.status_code 
200 


这 些 都 是 在 客户 端 看 到 的 网 页 的 基本 属性 
下 面 这 个 比较 长 ， 是 网 页 的 内 容 ， 仅 仅 截 取 显 示 的 部 分 


>>> print r.text 


<!IDOCTYPE html> 

<htm] lang="zh-CN"> 
<head> 
<meta charset="utf-8"> 
<meta name="viewport" content="width=device-width, initial-scale=1.0"> 
<title>1worldox00sec</title> 
<link rel="stylesheet" 

href="http://www,.1lworldOx00 .com/usr/themes/default/style.min.css"> 
<link rel="canonical" href="http://www.1worldOx00.com/" /> 
<link rel="stylesheet" type="text/css" 

href="http://www,.1lworldOx00 .com/usr/plugins/CodeBox/css/codebox.css" /> 
<meta name="description" content=" 爱 生活 ， 爱 拉 芳 。 不 装 逼 还 能 做 朋友 。 





TI /> 
<meta name="keywords" content="php" /> 
<link rel="pingback" href="http://www.1lworldOx00.com/index.php/action/xmlrpc" /> 


请 求 友 出 后 ，requests 会 基于 http 涉 部 对 相应 的 编码 做 出 有 根据 的 推 
测 ， 当 你 访问 rtext 时 ，requests 使 用 其 推测 的 文本 编码 。 你 可 以 找 出 
requests 使 用 了 什么 编码 ， 并 且 能 够 使 用 r.coding 属 性 来 改变 它 。 





>>> r.content 
'\xef\xbb\xbf\xef\xbb\xbf<!DOCTYPE html>\n<html lang="zh-CN">\n <head>\n <meta 


以 二 进 制 的 方式 打开 服务 器 并 返回 数据 。 


3.post 请 求 


假如 你 要 癌 某 个 服务 器 发 送 一 些 数据 ， 一 般 情况 下 ， 使 用 的 束 古 
post， 实 现 方式 也 比较 简单 ， 只 需要 传递 一 个 字典 给 data 参 数 。 


>>> import requests 

>>> payload = {"keyi":"valuei1", "key2":"value2"} 
>>> r = requests.post("http://httpbin.org/post") 
>>> r1 = requests.post("http://httpbin,.org/post", data=payload) 


r 没 有 提供 data 参 数值 ， 得 到 的 效果 是 : 


"args": {}, 
"datars TE 
"orn: {Fa 
Theadens™: 并 
"Reecept sy ™*/*™ 
"Accept-Encoding": "gzip, deflate", 
"Connection": "close", 
"Content-Length": "0"， 
most "httpbin.org™", 
"User-Agent": "python-requests/2.4.3 Cpython/2.7.8 Windows/7", 
"Xx-Request-Id": "1l9ed80fc-ffe6-4dc0-b83a-08dba09daf88" 
}， 
"json"s null, 
oriyin"s I LI. LL16.160", 
vB" WE/ Et 


r1 为 data 提 供 了 值 ， 再 看 效果 : 


{ 


Vangs™:s 澳 汪 
Eye 
上 GE ES 4 


TkeyL™s "valuael™ 
"key2": “value2" 
}, 


"headers": { 
"DEB /sn" 
"Accept-Encoding": "gzip, deflate", 
"Connection": "close", 
"Content Length: 23 
"Connent-Type": "application/x-www-form-urlencoded", 


"Host": httpbin.org™, 
"User-Agent": "python-requests/2.4.3 Cpython/2.7.8 Windows/7", 
"XxX-Request-Id": "b8ba897f-44c9-4922-b157-562e0cf07bcd" 

]s 

"ons ml; 

"orLgin™s "LL 113.116.160"; 

"arl": https//httpbin.org/post" 


新 闻 比 较 看 才 有 意思 ， 代 码 也 如 此 。 比 较 上 面 的 两 个 截图 ， 发 现 后 
者 当 data 被 赋值 之 后 ， 在 结 末 中 多 的 form 值 ， 就 多 了 data 所 传 入 的 值 ， 
form 的 值 就 是 post 给 服务 器 的 内 容 。 


4.http 头 部 


>>> r.headers['content-type'] 
"applLication/]json' 





注意 ， 引 号 里 面 的 内 容 不 区 分 大 小 写 “CONTENT-TYPE” 也 可 以 ， 
也 能 够 自 定 义 头 部 。 


>>> r.headers['content-type'] = 'adad' 
>>> r.headers['content-type'] 
"adad ' 


注意 ， 当 定制 头 部 的 时 候 ， 如 采 需 要 定制 的 项 目 有 很 多 ， 一 般 用 到 
字典 类 型 的 数据 。 


通过 一 个 实例 ， 展 示 第 三 方 模块 的 应 用 方法 ， 其 实 没有 什么 特殊 的 
地 方 ， 只 要 安 六 了 ， 殊 和 用 标准 库 模 块 一 样 了 。 


根据 我 的 个 人 经 验 ， 第 三 方 模块 党 音 在 茶 个 方面 做 得 更 友好 ， 或 者 
性 能 更 优化 ， 所 以 ， 不 要 将 其 放 在 我 们 的 视野 之 外 。 








第 7 章 ”你 存 数据 


如 果 在 程序 中 ， 有 数据 要 保存 到 磁盘 中 ， 放 到 茶 个 文件 中 是 一 种 不 
错 的 方法 。 但 是 ， 要 注意 存 到 文件 中 的 数据 不 能 随意 放置 ， 因 为 你 早晚 
还 要 把 数据 读 出 来 ， 如 果 没 有 什么 规律 ， 读 出 来 的 时 候 会 很 抹 烦 。 


很 多 开发 者 早 就 意识 到 这 点 了 ， 于 是 就 出 现 了 将 要 存储 的 对 象 格式 
化 《或 者 叫 作 序列 化 ) ， 即 按照 菜 种 特定 要 求 将 对 象 存 到 文件 中 ， 才 好 
存 好 取 ， 这 有 点 类 似 集装箱 的 作用 。 











7.1 pickle 


pickle 是 标准 库 中 的 一 个 模块 ， 还 有 跟 它 完全 一 样 的 叫 作 cpickle， 
两 者 的 区 别 就 是 后 者 更 快 〈 似 乎 已 经 是 一 个 规律 了 ， 凡 是 某 个 模块 前 面 
有 c， 就 意味 着 它 是 用 c 语 言 重 写 了 了 ， 也 意味 着 速度 更 快 些 ) 。 所 以 , 在 
下 面 的 操作 中 ， 不 管 是 用 import pickle， 还 是 用 import cpickle as pickle， 
在 功能 上 都 是 一 样 的 。 








>>> import pickle 

>>> integers = [1, 2, 3, 4, 5] 
>>> f = open("22901.dat", "wb") 
>>> pickle.dump(integers, f) 
>>> f.,close() 


用 pickle.dump (integers，f) 将 数据 integers 保 存 到 文件 22901.dat 
中 。 如 果 你 要 打开 这 个 文件 看 里 面 的 内 容 ， 可 能 会 有 点 失望 ， 但 是 ， 它 
对 计算 机 是 友好 的 。 这 个 步骤 可 以 称 之 为 将 对 象 序列 化 。 用 到 的 方法 


日 


征 : pickle.dump 《obj，file[，Pprotocol]) 。 


。 obj: 序列 化 对 象 ， 在 上 面 的 例子 中 是 一 个 列表 ， 它 是 基本 类 型 ， 
也 可 以 序列 化 自己 定义 的 类 型 。 

。file: 要 写 入 的 文件 。 可 以 更 广泛 地 理解 为 拥有 write(0) 方 法 的 对 象 ， 
并 且 能 接受 字符 串 为 参数 ， 所 以 ， 它 还 可 以 是 一 个 StringIO 对 象 ， 
或 者 其 他 自 定义 满足 条 件 的 对 象 。 

。 protocol: 可 选项 。 默 认为 False (或 者 说 0) ， 以 ASCII 格 式 保存 对 
象 ;， 如 果 设 置 为 1 或 者 True， 则 以 压缩 的 二 进 制 格式 保存 对 象 。 


换 一 种 数据 格式 ， 并 且 做 对 比 : 








>>> import pickle 

>>> d= {} 

>>> integers = range(9999) 

>>> d["i"] = integers # 下 面 将 这 个 


dict 格 式 的 对 象 存 入 文件 


>>> f = open("22902.dat", "wb") 
>>> pickle.dump(d, f) # 文 件 中 以 








ascii 格 式 保存 数据 


>>> f.close() 


>>> f = open("22903.dat", "wb") 
>>> pickle.dump(d, f, True) # 文 件 中 以 二 进 制 格式 保存 数据 























>>> f.close() 


>>> import os ea 
>>> S1 = os.stat("22902.dat").st_size # 得 到 两 个 文件 的 大 小 





>>> S2 = os.stat("22903.dat").st_size 


>>> print "%d, %d, %.2f%%" % (si, s2, (s2+0.0)/s1*100) 
68903, 29774, 43.21% 


比较 结果 发 现 ， 以 三 进 制 方式 保存 的 文件 比 以 ASCII 格 式 保存 的 文 
件 小 很 多 ， 前 者 约 是 后 者 的 43%。 

所 以 ， 在 序列 化 的 时 候 ， 特 别 是 面 对 较 大 对 象 时 ， 建 议 将 dump0 的 
参数 True 设置 上 ， 虽 然 现 在 存储 设备 的 价格 便宜 ， 但 是 能 省 的 还 是 省 点 
比较 好 。 


存 入 文件 ， 还 有 另外 一 个 目标 ， 就 是 要 读 出 来 ， 也 称 之 为 反 序 列 








化 有 


>>> integers = pickle.load(open("22901.dat", "rb")) 
>>> print integers 
[Lr 27.°37 4 5] 


再 看 看 被 以 二 进 制 方式 存 入 的 那个 文件 : 


>>> f = open("22903.dat", "rb") 

>>> d = pickle.1load(f) 

>>> print d 

{'i': [0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, .... 


站 








省 略 后 面 的 数字 











>>> f.close() 





如 果 是 目 己 定义 的 数据 类 型 ， 是 否 可 以 用 上 述 方式 存 入 文件 并 读 出 
来 呢 ? 看 下 面 的 例子 : 


























>>> import cPickle as pickle #cPickle 更 快 
>>> import StringI0 # 标 准 库 中 的 一 个 模块 ， 跟 
file 功 能 类 似 ， 





# 只 不 过 是 在 内 存 中 操作 “文件 ” 

















>>> class Book(object ) : # 自 定义 一 种 类 型 











def _ init (self,name): 
self.name = name 
def my_book(self): 
print "my book is: ", self.name 


>>> pybook = Book("<from beginner to master>") 
>>> pybook.my_book() 
my book is: <from beginner to master> 


>>> file = StringI0.StringI0() 
>>> pickle.dump(pybook, file, 1) 
>>> print file.getvalue() # 查 看 “文件 ”内容 ， 注 意 下 面 不 是 乱码 


























ccopy_reg 
_reconstructor 

qd?(C_ main_ _ 

Book 

qd?c__builtin _ 

object 

qd?NtRq?}qU?nameq?U?<from beginner to master>sb ， 

















>>> pickle.dump(pybook, file) # 换 一 种 方式 ， 再 看 内 容 ， 可 以 比较 一 下 




















>>> print file.getvalue() # 视 觉 上 两 者 就 有 很 大 差异 











ccopy_reg 
_reconstructor 
qd?(C_ main_ _ 
Book 


qd?c__builtin _ 

object 
qd?NtRq?}qU?nameq?U?<from beginner to master>sb.ccopy_reg 
_reconstructor 

p1 

(C_main_ _ 

Book 

p2 

c_ builtin _ 

object 

p3 

NtRp4 

(dp5 

S'name ' 

p6 

S'<from beginner to master>' 
p7 

sb. 


如 打从 文件 中 读 出 来 : 


>>> file.seek(0) # 找 到 对 应 类 型 





>>> pybook2 = pickle,. load(file) 

>>> pybook2.my_book() 

my book is: <from beginner to master> 
>>> file.close() 


7.2 Shelve 





pickle 模 块 已 经 表现 出 它 足 够 好 的 一 面 了 。 不 过 ， 由 于 数据 的 复杂 
性 ，pickle 只 能 完成 一 部 分 工作 ， 在 另外 更 复杂 的 情况 下 ， 它 就 稍 显 麻 
烦 了 ， 于 是 ， 又 有 了 shelve。 


shelve 模 块 也 是 标准 库 中 的 ， 先 看 看 基本 的 写 、 读 操作 。 











>>> import shelve 

>>> S = shelve.open("22901.db") 

>>> s["name"] "www.itdiffer.com" 

>>> s["lang"] "python" 

>>> S["pages"] = 1000 

>>> s["contents"] = {"first":"base knowledge", "second":"day day up"} 
>>> s.close() 


以 上 完成 了 数据 号 入 的 过 程 ， 其 实 ， 这 很 接近 数据 库 的 样式 了 。 下 


>>> S = shelve.open("22901.db") 

>>> name = s["name"] 

>>> print name 

www.itdiffer.com 

>>> contents = s["contents"] 

>>> print contents 

{'second': 'day day up', 'first': 'base knowledge'} 


看 到 输出 的 内 容 ， 你 一 定 想 到 ， 表 定 可 以 用 for 语 句 来 恋 ， 想 到 了 就 
用 代码 来 测试 ， 这 就 是 Python 交互 模式 的 便利 之 处 。 


>>> for k in s: 
print k, s[k] 


contents f{'second': 'day day up', 'first': 'base knowledge'} 
lang python 

pages 1000 

name www.itdiffer.com 








不 管 是 写 还 是 恋 ， 痢 似乎 要 简化 了 。 所 建立 的 对 象 s， 束 如 同 字 典 
一 样 ， 可 称 之 为 类 字典 对 象 ， 所 以 ， 可 以 如 同 操作 字典 那样 来 操作 它 。 


但 是 ， 小 心 有 坑 : 


>>> f = shelve.open("22901.db") 

>>> f["author"] 

['qiwsir'] 

>>> f["author"].append("Hetz") # 试 图 增加 一 个 























>>> f["author"] # 坑 就 在 这 里 











['qiwsir'] 
>>> f.close() 


当 试 图 修改 一 个 已 有 键 的 值 时 没有 报错 ， 但 是 并 没有 修改 成 功 。 要 
填 平 这 个 坑 ， 震 要 这 样 做 : 


>>> f = shelve.open("22901.db", writeback=True) # 多 一 个 参数 


True 
>>> f["author"].append("Hetz") 
>>> f["author"] # 没 有 坑 了 


['qiwsir', 'Hetz'] 
>>> f.close() 


还 用 for 循 环 一 下 : 


>>> f = shelve.open("22901.db") 
>>> for k,v in f.items(): 
print k,": "jv 


contents : {'second': 'day day up', 'first': 'base knowledge'} 
lang : python 

pages : 1000 

author : ['giwsir', 'Hetz'] 

name : www.itdiffer.com 


shelve 更 像 数 据 库 了 。 不 过 ， 它 还 不 是 真正 的 数据 库 ， 真 正 的 数据 
库 在 后 面 。 


7.3 ”MySQL 数据 库 


尽管 用 文件 形式 将 数据 保存 到 磁盘 ， 已 经 是 一 种 不 错 的 方式 。 但 
是 ， 人 们 还 是 发 明了 更 具有 格式 化 特点 ， 并 且 写 入 和 读 取 更 快速 便捷 的 
东西 一 一 数据 库 。 维 基 百 科 对 数据 库 有 比较 详细 的 说 明 : 


数据 库 指 的 是 以 一 定 方式 储存 在 一 起 、 能 为 多 个 用 户 共有 享 、 具 有 尽 
可 能 小 的 元 余 度 、 与 应 用 程序 彼此 独立 的 数据 集合 。 


到 目前 为 止 地 球 上 有 以 下 三 种 类 型 的 数据 。 


。 关系 型 数据 库 : MySQL、Microsoft Access、SQL Server、 

















。 非 关系 型 数据 库 : MongoDB、BigTable (Google) ...... 
。 刍 值 数据 库 : Apache Cassandra (Facebook) 、LevelDB (Google) 


7.3.1 MySQL 概 况 





MySQL 是 一 个 使 用 非常 广泛 的 数据 库 ， 很 多 网 站 都 使 用 它 。 关 于 
这 个 数据 库 有 很 多 传说 ， 例 如 维基 百科 上 有 这 么 一 段 : 


MySQL 原 本 是 一 个 开放 源 代 码 的 关系 数据 库 管理 系统 ， 原 开发 者 
为 瑞典 的 MySQL AB 公 司 ， 该 公司 于 2008 年 被 太阳 微 系统 《Sun 
Microsystems) 收购 。2009 年 ， 甲 骨 文 公司 〈Oracle) 收购 太阳 微 系统 
公司 ，MySQL 成 为 Oracle 旗 下 产品 。 


MySQL 在 过 去 由 于 性 能 高 、 成 本 低 、 可 靠 性 好 ， 已 经 成 为 最 流行 
的 开源 数据 库 ， 因 此 被 广泛 地 应 用 在 Intermmet 上 的 中 小 型 网 站 中 。 随 大 
MySQL 的 不 断 成 熟 ， 也 逐渐 被 用 于 更 多 大 规模 网 站 和 应 用 ， 比 如 维基 
百科 、Google 和 Facebook 等 网 站 。 非 常 流行 的 开源 软件 组 合 LAMP 中 
的 “M” 指 的 就 是 MySQL。 


但 被 甲骨 文公 司 收购 后 ，Oracle 大 幅 调 涨 MySQL 商 业 版 的 售 价 ， 且 
甲骨 文公 司 不 再 文 持 另 一 个 自由 软件 项 目 OpenSolaris 的 发 展 ， 因 此 导致 
目 由 软件 社区 们 对 于 Oracle 是 人 否 还 会 持续 文 持 MySQL 社 区 版 (MySQL 
之 中 唯一 的 免费 版 本 ) 有 所 隐忧 ， 因 此 原先 一 些 使 用 MySQL 的 开源 软 
件 逐 渐 转 同 其 他 的 数据 库 。 例 如 维基 百科 已 于 2013 年 正式 宣布 将 从 
MySQL 迁 移 到 MariaDB 数 据 库 。 


不 管 怎 样 ，MVYSQL 依 然 是 一 个 不 错 的 数据 库 选 择 ， 足 够 文 持 读者 
完成 一 个 不 小 的 网 站 。 


32 区 


你 的 电脑 或 许 不 会 天 生 就 有 MySQL， 它 本 质 上 也 是 一 个 程序 ， 知 


有 必要 ， 需 安装 。 


我 用 Ubuntu 操作 系统 演示 ， 因 为 我 相信 读者 将 来 在 真正 的 工程 项 目 
中 ， 多 数 情况 下 要 操作 Linux 系 统 的 服务 器 ， 并 且 ， 我 酷爱 用 Ubuntu。 
本 书 的 目标 是 from beginner to master， 不 管 是 不 是 真 的 master， 也 要 闭 
得 像 ，Linux 能 够 给 你 撑 门 面 ， 这 也 是 推荐 使 用 Ubuntu 的 原因 。 








第 一 步 ， 在 shell 端 运行 如 下 命令 : 


sudo apt-get install mysql-server 








运行 完毕 就 安装 好 了 这 个 数据 库 ， 是 不 是 很 简单 呢 ? 当然， 还 要 进 
行 配置 。 


第 二 步 ， 配 置 MySQL 

安装 之 后 ， 运 行 : 

re 

启动 MySQL 数 据 库 ， 然 后 进行 下 面 的 操作 ， 对 其 进行 配置 。 
默认 的 MySQL 安 装 之 后 根 用 户 是 没有 密码 的 ， 注 意 ， 这 里 有 一 个 


名 词 “ 根 用 户 ”， 其 用 户 名 是 : root。 运 行 : 


$mysql -u root 


nn 会 看 到 “>” 符 号 开头 ， 这 就 是 MySQL 的 命令 操作 
界面 了 。 


下 面 设置 MySQL 中 的 root 用 户 密码 ， 否 则 ，MySQL 服 务 无 安全 可 言 
Ts 


mysql> GRANT ALL PRIVILEGES ON *.* TO root@localhost IDENTIFIED BY "123456"; 





用 123456 作 为 root 用 户 的 密码 ， 应 该 是 非常 患 蕊 的 ， 在 真正 的 项 目 
中 最 好 别 这 样 做 ， 要 用 大 小 写字 母 与 数字 混合 的 密码 ， 且 不 少 于 8 位 。 
以 后 如 果 再 登录 数据 库 ， 就 可 以 用 刚才 设置 的 密码 了 。 





733 运行 


安装 完 就 要 运行 它 ， 并 操作 这 个 数据 库 。 


$ mysql -u root -p 
Enter password: 


输入 数据 库 的 密码 ， 之 后 出 现 : 


Welcome to the MySQL monitor. Commands end with ; or \g. 

Your MySQL connection id is 373 

Server version: 5.5.38-OQubuntu0.14.04.1 (Ubuntu) 

Copyright (c) 2000, 2014, Oracle and/or its affiliates. All rights reserved. 
Oracle is a registered trademark of Oracle Corporation and/or its 


affiliates. Other names may be trademarks of their respective 
owners. 


Type 'help;' or '\h' for help. Type '\c' to clear the current input statement. 


mysql> 





藉 吉 你， 已 经 进入 到 数据 操作 界面 了 ， 接 下 来 吏 可 以 对 这 个 数据 进 
行 操 作 了 。 例 如 : 


| 
| information_schema | 
carstore | 
cutvideo | 
itdiffer | 
mysql | 
performance_schema | 
tes | 


“show databases;”( 最 后 的 半角 分 号 别 忘记 了 ) 命令 表示 列 出 当前 
已 经 有 的 数据 库 。 


对 数据 库 的 操作 ， 除 了 用 命令 之 外 ， 还 可 以 使 用 一 些 可 视 化 工具 ， 
比如 phpmyadmin 就 是 不 错 的 。 


， 更 多 数据 库 操 作 的 知识 ， 这 里 就 不 再 介绍 了 ， 读 者 可 以 参考 有 关 书 
籍 。 

MySQL 数 据 库 已 经 安装 好 ， 但 是 Python 还 不 能 操作 它 ， 还 要 继续 安 
装 Python 操 作 数 据 库 的 模块 一 一 python-MySQLdb 


7.3.4 ”安装 python-MySQLdb 


python-MySQLdb 是 一 个 接口 程序 ，Python 通 过 它 对 MySQL 数 据 实 
现 各 种 操作 。 


在 编程 中 会 遇 到 很 多 类 似 的 接口 程序 ， 通 过 接口 程序 对 另外 一 个 对 
象 进 行 操作 。 接 口 程序 就 好 比 钥匙 ， 如 果 要 开锁 ， 直 接 用 手指 去 捅 肯定 
古人 不行 的 ， 必 须 借助 工具 插入 到 锁 孔 中 ， 把 锁 打 开 ， 门 开 了 ， 就 可 以 操 
作 门 里 面 的 东西 了 ， 那 么 打开 锁 的 工具 就 是 接口 程序 。 谁 都 知道 ， 用 对 
应 的 钥匙 开锁 是 最 好 的 ， 如 果 用 别 的 工具 (比如 锤子 ) 或 许 不 便利 ( 当 
0 
在 因 系 。 


python-MySQLdb 就 是 打开 MySQL 数 据 库 的 钥匙 。 











如 果 要 源码 安装 ， 其 源码 下 载 地 址 : 
https://pypi.python.org/pypi/MySQL-python/。 下 载 之 后 就 可 以 安装 了 。 


在 Ubuntu 操作 系统 下 还 可 以 用 软件 仓库 来 安装 。 


sudo apt-get install build-essential python-dev libmysqlclient-dev 
sudo apt-get install python-MySQLdb 


也 可 以 用 pip 来 安装 : 
pip install mysql-python 

安装 之 后 ， 在 Python 交 互 模式 下 : 
>>> import MySQLdb 


如 果 不 报 错 ， 那 么 恭喜 你 ， 已 经 安装 好 了 。 如 果 报错 ， 那 么 共 喜 
你 ， 可 以 借 着 错误 信息 提高 自己 的 计算 机 水 平 。 








7.3.5 ”连接 数据 库 


连接 数据 库 之 前 要 先 建立 数据 库 。 


$ mysql -u root -p 
Enter password: 


进入 到 数据 库 操作 界面 : 


mysql> 


输入 如 下 命令 ， 建 立 一 个 数据 库 : 


mysql> create database qiwsirtest character set utf8; 
Query OK, 1 row affected (0.00 sec) 


注意 上 面 的 指令 ， 如 果 仅 仅 输入 create database qiwsirtest 也 可 以 ， 
但 是 我 在 后 面 增加 了 character set utf8， 意 思 是 所 建立 的 数据 库 


qiwsirtest， 编 码 是 utf-8， 这 样 存 入 汉字 就 不 是 乱码 了 。 


看 到 那 一 行 提示 : Query OK，1 row affected (0.00 sec) ， 说 明 这 


个 数据 库 已 经 建立 好 了 ， 名 字 叫 作 qiwsirtest 


My 


数据 库 建 立 之 后 ， 就 可 以 用 Python 通过 已 经 安装 的 python- 
SQLdb 来 连接 这 个 名 字 叫 作 qiwsirtest 的 库 了 。 


>>> import MySQLdb 


>>> conn = MySQLdb .connect(host="]localhost", user="root", passwd="123123", db="qiws 


下 面 逐个 解释 上 述 命令 的 含义 。 


host: 等 号 的 后 面 应 该 填写 MySQL 数 据 库 的 地 址 ， 因 为 数据 库 束 在 
本 机 上 ， 所 以 使 用 localhost， 注 意 引 号 。 如 果 在 其 他 的 服务 器 上 ， 
这 里 应 该 填写 耳 地 址 。 一 般 中 小 型 的 网 站 ， 数 据 库 和 程序 都 是 在 同 
一 台 服 务 器 (计算 机 〉 上 ， 就 使 用 localhost 了 。 
user: 登录 数据 库 的 用 户 名 ， 这 里 一 般 填 写 “root”， 还 是 要 注意 引 
EE 当然 ， 如 果 读 者 命名 了 别 的 用 户 名 ， 就 更改 为 相应 用 户 。 但 
是 ， 不 同 用 户 的 权限 可 能 不 同 ， 所 以 ， 在 程序 中 ， 如 果 要 操作 数据 
库 ， 还 要 注意 所 拥有 的 权限 。 在 这 里 用 root， 束 什么 权限 都 有 了 。 
不 过 ， 这 种 做 法 在 大 型 系统 中 是 应 该 避免 的 。 
passwd: user 账 户 登录 MySQL 的 密码 。 例 子 中 用 的 密码 
0 不 要 起 记 引 号 。 

: 就 是 刚刚 通 create 命 令 建 立 的 数据 库 ， 数 据 库 名 字 
是 : RS: ， 还 是 要 注意 引号 。 如 果 你 建立 的 数据 库 名 字 不 是 这 
个 ， 束 与 自己 所 建 数据 库 的 名 字 。 
port: 一 般 情况 ， MySQL 的 默认 端口 是 3306。 当 MySQL 被 安装 到 服 
Rn 为 了 能 够 允许 网 络 访问 ， 服 务 器 〈 计 算 机 ) 要 提供 一 
访问 问 口 人 
charset: 这 个 设置 ， 在 很 多 教程 中 都 不 写 ， 绎 二 果 在 真正 进行 数据 存 
储 的 时 候 ， 发 现 有 乱码 。 这 里 将 qiwsirtest 这 个 数据 库 的 编码 设置 为 
utf-8 格 式 ， 这 样 就 允许 存 入 汉字 而 无 乱码 了 。 注 总， 在 MySQL 设 
置 中 ，utf-8 写 成 utf8， 没 有 中 间 的 横 线 ， 但 是 在 Python 文件 开头 和 
其 他 地 方 设 置 编码 格式 的 时 候 要 写成 utf-8。 


注 : connect 中 的 所 有 参数 ， 可 以 只 按照 顺序 把 值 写 入 。 但 是 ， 我 






































推荐 读者 的 写法 还 是 上 面 的 方式 ， 以 免 出 了 乱 子 自己 还 糊涂 。 


其 实 ， 关 于 connect 的 参数 还 有 别 的 ， 读 者 可 以 到 MySQLdb 官 方 碍 
人 
反复 阅读 。 


至 此 ， 已 经 完成 了 数据 库 的 连接 。 





7.3.6 ”数据 库 表 


束 数 据 库 而 言 ， 连 接 之 后 就 要 对 其 操作 。 但 是 ， 目 前 名 字 叫 作 
qiwsirtest 的 数据 库 仅 仅 是 空 保 子 ， 没 有 什么 可 操作 的 ， 要 操作 它 ， 束 必 
须 在 里 面 建立 “ 表 ”*”， 什 么 是 数据 库 的 表 呢 ?下 面 摘抄 维基 百科 对 数据 库 
表 的 简要 解释 。 


在 关系 数据 库 中 ， 数 据 库 表 是 一 系列 二 维 数组 的 集合 ， 用 来 代表 和 
储存 数据 对 象 之 间 的 关系 。 它 由 纵 疝 的 列 和 横向 的 行 组 成 ， 例 如 一 个 有 
关 作 者 信息 的 名 为 authors 的 表 中 ， 每 个 列 包 含 的 是 所 有 作者 的 人 条 个 特定 
类 型 的 信息 ， 比 如 “姓氏 ”， 而 每 行 则 包含 了 茶 个 特定 作者 的 所 有 信息 : 
姓 、 名 、 住 址 等 。 


对 于 特定 的 数据 库 表 ， 列 的 数目 一 般 事先 固定 ， 各 列 之 间 可 以 由 列 
名 来 识别 。 而 行 的 数目 可 以 随时 动态 变化 ， 通 常 每 行 都 可 以 根据 茶 个 
(或 条 几 个 ) 列 中 的 数据 来 识别 ， 称 为 候选 键 。 


在 qiwsirtest 中 建立 一 个 存储 用 户 名 、 用 户 密 码 、 用 户 邮 箱 的 表 ， 其 
结构 用 二 维 表格 表现 如 下 : 























特别 说 明 ， 这 里 为 了 简化 细节 、 突 出 重点 ， 对 密码 不 加 密 ， 和 直接 明 
文保 存 ， 虽 然 这 种 方式 是 很 不 安全 的 。 据 小 道 消 轧 ， 有 的 网 站 居然 用 明 
文 你 存 密 码 ， 这 么 做 的 目的 是 比较 可 有 恶 的 。 束 让 我 在 这 里 ， 仪 仅 在 这 里 
可 恶 一 次 。 


因为 直接 操作 数据 不 是 本 书 重 点 ， 但 是 关联 到 后 面 的 操作 ， 为 了 让 
读者 在 阅读 上 连贯 ， 快 速 地 说 明 建立 数据 库 表 并 输入 内 容 。 








mysql> use qiwsirtest 
Database changed 
mysql> show tables; 
Empty set (0.00 sec) 





用 Show tables 命 令 显 示 这 个 数据 库 中 是 否 有 数据 表 了 ， 查 询 结 果 显 
示 为 空 。 


用 如 下 命令 建立 一 个 数据 表 ， 这 个 数据 表 的 内 容 就 是 上 面 所 说 明 
的 。 

mysql>create table users(id int(2) not nul primary key 
auto_increment,username varchar(40),password text,email text)default 


charset=utf8; 


Query OK, © rows affected (0.12 sec) 


建立 的 这 个 数据 表 名 称 是 : users， 其 中 包含 上 述 字段 ， 可 以 用 下 面 
的 方式 看 一 看 这 个 数据 表 的 结构 。 


mysql> show tables; 


1 row in set (96.66 sec) 





查询 显示 ， 在 qiwsirtest 这 个 数据 库 中 已 经 有 一 个 表 ， 它 的 名 字 是 : 


USersS 。 


mysql> desc users; 


+---------- +------------- +------ +----- +--------- +---------------- 十 
| Field | Type | Null | Key | Default | Extra | 
+---------- +------------- +------ +----- +--------- +---------------- 十 
| id | int(2) | NO | PRI | NULL | auto increment | 
| username | varchar(46) | YES | | NULL | 
| password | text | YES | | NULL | 
| email | text | YES | | NULL | 
+---------- +------------- +------ 十 ----- +--------- +---------------- 一 


4 rows in set (8.80 sec) 


显示 出 来 表 users 的 结构 。 


特别 提醒 : 上 述 所 有 字段 设置 仅 为 演示 ， 在 实际 开发 中 ， 要 根据 
具体 情况 来 确定 字段 的 属性 


如 此 区 得 到 了 一 个 空 表 ， 可 以 得 询 看 看 : 





mysql> Select * from users; 
Empty set (0.01 sec) 


回 里 面 插入 一 条 信 言 息 : 


mysql> insert into users(username,password,email) 
values("qiwsir","123123", "qiwsir@gmail.com"); 
Query OK, 1 row affected (0.05 sec) 

mysql> select * from users; 


下 二 二 二 三 二 二 二 二 二 二 和 + 
| id | username | password | email | 
+----+---------- +---------- +------------------ 一 
| 1 | qiwsir | 123123 | qiwsir@egmail.com | 
+----+---------- +---------- +------------------ 十 
1 row in set (8.96 sec) 


这 样 束 得 到 了 一 个 有 内 容 的 数据 库 表 。 


7.3.7 ”操作 数据 库 


连接 数据 库 。 


>>> import MySQLdb 
>>> conn = MySQLdb .connect(host="]localhost",user="root",passwd="123123", db= "qiwsir 





Python 建立 了 与 数据 的 连接 ， 其 实 是 建立 了 一 个 MYSQLdb.connect() 
的 实例 对 象 ， 或 者 泛泛 地 称 之 为 连接 对 象 ，Python 就 是 通过 连接 对 象 和 
数据 库 对 话 。 这 个 对 象 常 用 的 方法 如 下 。 


。 commit(): 如 果 数 据 库 表 进行 了 修改 ， 提 交 保 存 当 前 的 数据 。 当 
然 ， 如 果 此 用 户 没有 权限 就 作罢 ， 什 么 也 不 会 发 生 。 
。 rollback(): 如 果 有 权限 ， 就 取消 当前 的 操作 ， 人 否则 报错 。 
。 cursor 〈[cursorclass]) : 返回 连接 的 游标 对 象 。 通 过 游标 执行 SQL 
人 游标 比 连接 文 持 更 多 的 方法 ， 而 且 可 能 在 程序 中 
了 用 。 
。 close(): 关闭 连接 。 此 后 ， 连 接 对 象 和 游标 都 不 再 可 用 了 。 


Python 和 数据 之 间 的 连接 建立 起 来 之 后 ， 奇 要 操作 数据 库 ， 束 需要 
让 Python 对 数据 库 执 行 SQL 语句 。 

Python 是 通过 游标 执行 SQL 语句 的 ， 所 以 ， 连 接 建 立 之 后 ， 束 要 利 
用 连接 对 象 得 到 游标 对 象 ， 方 法 如 下 : 











>>> cur = conn.cursor() 


此 后 ， 就 可 以 利用 游标 对 象 的 方法 对 数据 库 进 行 操作 ， 那 么 还 得 了 
解 游 标 对 象 的 常用 方法 ， 如 表 7-1 所 示 。 


表 7-1 游标 对 象 的 常用 方法 





称 
close0 关闭 游标 








execute(query[.args]) 妆 行 一 条 SQL 语句 ， 可 以 带 参 数 





executemany(query. pseq) 序列 pseq 中 的 每 个 参数 执行 sql 语句 





fetchone() 返回 一 条 查询 结果 








fetchall() 返回 所 有 查询 结果 


fetchmany([size]) 

















nextset() 








动 游标 到 指定 行 ，mode='relative'， 表 示 从 当前 行 开始 移动 value 条 ; mode='absolute'， 表 


scroll(value.mode='relative') ep 
示 从 第 一 行 开 始 移动 value 条 








1. 插 入 
例如 ， 要 在 数据 表 users 中 插入 一 条 记录 ， 使 得 : 


username="python", password="123456", email="python@gmail.com", 
这 样 做 : 


>>> cur.execute("insert into users (username,password,email) values (%s,%s,%s)", (" 
1L 


没有 报错 ， 并 且 返 回 一 个 "1L" 结 果 ， 说 明 有 一 行 记录 操作 成 功 。 不 
妨 进入 到 “mysql>” 交 互 方式 查看 (读者 可 以 在 男 外 一 个 shell 中 进行 操 
作 ) : 


mysql> select * from users,; 


+---- 寺 ---------- +---------- +------------------ 一 
| id Username password email | 
+----+---------- +---------- +------------------ 一 
| 1 | qiwsir | 123123 | qiwsir@email.com | 
二 -一 一 -二 ---------- +---------- +------------------ 一 


1 row in set (8.66 sec) 


怎么 没有 看 到 增加 的 那 一 条 呢 ? 哪里 错 了 ? 上 面 也 没有 报错 。 


特别 注意 ， 通过 “cur.execute0)> 对 数据 库 进 行 操作 之 后 ， 没 有 报 
错 ， 完 全 正确 ， 但 是 不 等 于 数据 就 已 经 提交 到 数据 库 中 了 ， 还 必须 要 用 
到 “MySQLdb.connect” 的 一 个 属性 : commit()， 将 数据 提交 上 去 ， 也 束 
是 进行 了 “cur.execute()” 操 作 之 后 ， 必 须要 将 数据 提交 才能 有 效 改 变数 据 


库 表 。 











>>> conn.commit() 


再 到 “mysgl>” 中 运行 “select*from users” 试 一 试 : 


mysql> select * from users,; 


+----+---------- +---------- +------------------ 一 
| id | username | password | email | 
+----+---------- +---------- +------------------ 一 
| 生路 qiwsir | 123123 | qiwsirQ@gmail.com | 
| 2 | python | 123456 | python@email.com | 
4- 一- 十 ---------- 4---------- +------------------ 一 
2 rows in set (8.80 sec) 


果然 如 此 。 


这 就 如 同 编写 一 个 文本 一 样 ， 将 文字 写 到 文本 上 ， 并 不 等 于 文字 已 
经 保留 在 文本 文件 中 了 ， 必 须 执行 “CTRL-S” 才 能 保存 。 所 有 
以 “execute()” 执 行 的 各 种 sql 语 句 之 后 ， 要 让 已 经 执行 的 效果 保存 ， 都 必 
须 运行 连接 对 象 的 “commit()” 方 法 。 


尝试 一 下 插入 多 条 的 那个 命令 “executemany (query，args) ”。 











>>> cur.executemany("insert into users (username,password,email) values (%s,%s,%s)" 
4L 
>>> conn.commit() 


到 “mysql>” 里 面 看 结果 : 


mysql> select * from users; 


+----+---------- +---------- +------------------ 一 
| id | username | password | email | 
+----+---------- +---------- +------------------ = 
| 1 | qiwsir | 123123 | qiwsir@egmail.com | 
| 2 | python | 123456 | python@gmail.com | 
| 3 | google | 和 414222 | g@gmail .com | 
| 4 | facebook | 222333 | f@face.book | 
| 5 | github | 333444 | git@hub. com | 
| 6 | docker | 444555 | doc@ker .com | 
+----+---------- +---------- +------------------ 十 


6 rows in set (8.66 sec) 


成 功 插入 了 多 条 记录 。 (query，pseq) ”中 ，query 
还 是 一 条 sql 语 句 ， 但 是 pseq 这 时 候 是 寺 别 注意 一 环 
套 一 环 的 括号 ，j 放 个 元 得 里 而 的 元 素 也 是 宛 组 ， 每 个 元 组 分 别 对 应 sql 语 
句 中 的 字段 列表 。 


除了 插入 命令 ， 其 他 对 数据 操作 的 命令 都 可 以 用 类 似 上 面 的 方式 ， 
比如 删除 、 修 改 等 。 




















如 末 要 从 数据 库 中 查询 数据 ， 也 用 游标 方法 来 操作 。 


>>> cur.execute("select * from users") 
7L 





说 明 从 users 表 汇总 查询 出 来 了 7 条 记录 。 但 是 ， 这 似 于 有 尽 个 及 
a 7 条 记录 在 哪里 呢 ? 如 采 在 "mysql>” 下 操作 查询 合 下 把 7 
条 记录 列 出 来 了 ， 在 这 里 怎么 显示 Python 的 查询 结果 呢 ? 


要 用 到 游标 对 象 的 fetchall0、fetchmany (size=None) 、 
fetchone()、scroll (value，mode=relative') 等 方法 。 


>>> cur.execute("select * from users") 
7L 
>>> lines = cur.fetchall() 


至 此 已 经 将 查询 到 的 记录 赋值 给 变量 lines 了 ， 如 果 要 把 它们 显示 出 
来 ， 就 要 用 到 曾经 学 习 过 的 循环 语句 。 
>>> for line in lines: 
print line 


(1L, 


uU'gqiwsir', u'123123', U'giwsir@gmail.com') 
(2L, u'python', u'123456', u'python@gmail.com') 
(3L, u'google', u'111222', u'g@gmail.com') 
(4L, u'facebook', u'222333', Uu'f@face.book') 
(5L, u'github', u'333444', u'git@hub.com') 
(6L, u'docker', u'444555', u'doc@ker.com') 

U 8 


(7L, Uu'\u8001\u9f50', u'9988', Uu'giwsir@gmail.com') 





很 好 ， 果然 逐条 显示 出 来 了 。 i 青 读 者 注意 ， 第 七 条 中 的 
u\u8001\u95f5'"， 在 这 里 是 汉字 ， 只 是 由 于 我 的 shell 不 人 EE 显示 里 了 ， 不 必 








惊 屋 ， 也 不 必 搭 理 它 。 
只 想 查 出 第 一 条 ， 可 以 吗 ? 当然 可 以 ， 再 看 下 面 : 


>>> cur.execute("select * from users where id=1") 
1L 
>>> line_first = cur.fetchone( ) # 只 返回 一 





>>> print line_ first 
(1L, u'qiwsir', u'123123', u'qiwsir@gmail.com') 


为 了 对 上 述 过 程 了 解 深 入 ， 做 下 面 的 实验 : 


>>> cur.execute("select * from users") 

7L 

>>> print cur.fetchall() 

((1L, u'giwsir', Uu'123123', Uu'diwsir@gmail.com'), (2L, u'python', u'123456', u'pyth 





原来 ， 用 cur.execute0 从 数据 库 得 询 出 来 的 东西 ， 被 “保存 在 了 cur 所 
能 找到 的 某 个 地 方 "”” 要 找 出 这 些 被 保存 的 东西 ， 需 要 用 cur.fetchall() 
(或 者 fechone 等 ) ， 并 且 找 出 来 之 后 ， 作 为 对 象 存在 。 从 上 面 的 实验 探 
讨 发 现 ， 返 回 值 是 一 个 元 组 对 象 ， 里 面 的 每 个 元 素 ， 又 是 一 个 一 个 的 元 
组 对 象 ， 因 此 ， 用 for 循 环 就 可 以 一 个 一 个 拿 出 来 了 。 


接着 上 面 的 操作 ， 再 打印 一 








>>> print cur.fetchall() 





怎么 是 空 ? 不 是 说 作为 对 象 已 经 存在 于 内 存 中 了 吗 ? 难道 这 个 内 存 
中 的 对 象 仅 一 次 有 效 吗 ? 


不 要 着 急 ， 这 就 是 神奇 所 在 。 


通过 游标 找 出 来 的 对 象 ， 在 读 取 的 时 候 有 一 个 特点 ， 就 是 那个 游标 
会 移动 。 在 第 一 次 操作 了 print cur.fetchalO 后 ， 因 为 是 将 所 有 的 都 打印 
出 来 ， 游 标 束 从 第 一 条 移动 到 最 后 一 条 。 当 print 结 束 之 后 ， 游 标 已 经 在 
接 下 来 如 果 再 次 打印 ， 就 空 了 ， 最 后 一 条 后 面 没有 








下 面 还 要 进行 实验 ， 检 验 上 面 所 说 : 


>>> cur.execute('select * from users') 

7L 

>>> print cur.fetchone() 

(1L, u'qiwsir', u'123123', u'qiwsir@gmail.com') 
>>> print cur.fetchone() 

(2L, u'python', u'123456', u'python@gmail.com') 
>>> print cur.fetchone() 

(3L, u'google', u'111222', u'g@gmail.com') 


这 次 不 再 一 次 性 全 部 打印 出 来 了 ， 而 是 每 次 打印 一 条 ， 从 结果 中 可 
以 看 出 来 ， 那 个 游标 果然 在 一 条 一 条 癌 下 移动 呢 。 注 意 ， 在 这 次 实验 中 
重新 运行 了 得 询 语句 。 


那么 ， 既 然 操作 存储 在 内 存 中 的 对 象 时 游标 会 移动 ， 能 不 能 让 游标 
癌 上 移动 ， 或 者 移动 到 指定 位 置 呢 ? 这 就 是 scroll0)。 























>>> cur.scroll(1) 

>>> print cur.fetchone() 

(5L, u'github', u'333444', u'git@hub.com') 
>>> cur.scroll(-2) 

>>> print cur.fetchone() 

(4L, u'facebook', u'222333', Uu'f@face.book') 





果然 ， 这 个 函数 能 够 移动 游标 ， 请 仔细 观察 ， 上 面 的 方式 是 让 游标 
相对 于 当前 位 置 同上 或 者 同 下 移动 。 即 cur.scroll (n) 或 者 
cur.scroll (n，"relative") ， 意 思 是 相对 于 当前 位 置 则 上 或 者 疝 下 移动 ， 
知 Dn 为 正 数 ， 则 表示 癌 下 《〈 同 前 ) ， 知 n 为 负数 ， 则 表示 同上 《〈 辐 后 ) 


还 有 一 种 方式 可 以 实现 “绝对 ”移动 ， 而 不 是 “相对 ”移动 : 增加 一 个 
参数 "absolute"。 


但 在 Python 中 ， 序 列 对 象 的 顺序 是 从 0 开始 的 。 




















>>> cur.scroll(2, "absolute") # 回 到 序号 是 














2， 但 指向 第 三 条 














>>> print cur.fetchone() # 打 印 ， 果 然 是 


(3L, u'google', u'111222', u'g@gmail.com') 


>>> cur.scroll(1, "absolute") 
>>> print cur.fetchone() 
(2L, u'python', u'123456', u'python@gmail.com') 


>>> cur.scroll(0, "absolute") # 回 到 序号 是 


9, 即 指向 第 一 条 





>>> print cur.fetchone() 
(1L, u'qiwsir', u'123123', u'qiwsir@gmail.com') 


至 此 ， 己 经 邵 悉 了 cur.fetchall() 和 cur.fetchone() 以 及 cur.scroll0 的 几 
个 方法 ， 还 有 一 个 方法 ， 即 游标 在 序号 是 1 的 位 置 ， 指 同 第 二 条 。 











>>> cur.fetchmany(3) 
((2L, u'python', uyu'123456', Uu'python@gmail.com'), (3L, u'google', uyu'111222', uU'gQ@gm 


上 面 这 个 操作 ， 就 是 实现 了 从 当前 位 置 “游标 指 癌 tuple 序 号 为 1 的 
位 置 ， 即 第 二 条 记录 ) 开始 ， 合 当前 位 置 ， 癌 下列 出 3 条 记录 。 


读 取 数 据 ， 好 像 有 点 吵 喷 ， 但 细 细 琢磨 ， 还 是 有 道理 的 。 
Python 总 是 能 够 为 我 们 着 想 的 ， 在 连接 对 象 的 游标 方法 中 提供 了 一 


个 参数 ， 可 以 实现 将 读 取 到 的 数据 变 成 字典 形式 ， 这 样 就 提供 了 为 外 一 
种 读 取 方 式 。 





>>> cur = conn.cursor(cursorclass=MySQLdb.cursors.DictCursor) 
>>> cur.execute("select * from users") 


7L 
>>> cur.fetchall() 
({'username': U'dqiwsir'， "password': U'123123'， 'id': 1L, "email': u'qiwsir@gmail.c 





这 样 ， 在 元 组 里 面 的 元 素 就 是 一 个 一 个 字典 : 


>>> cur.scroll(0,"absolute") 
>>> for line in cur.fetchal1() : 
print line["username"] 


diwsir 
mypython 
google 
facebook 
github 
docker 


根据 字典 对 象 的 特点 来 读 取 “ 键 - 值 ”。 


7.3.8 ”更 新 数据 


熟悉 了 前 面 的 操作 ， 再 到 这 里 一 切 都 显得 那么 简单 。 但 仍 要 提醒 的 
是 ， 如 果 更 新 完毕 ， 和 插入 数据 一 样 ， 痢 需要 commit() 来 提交 保存 。 


>>> cur.execute("update users set username=%s where id=2", ("mypython")) 
1L 

>>> cur.execute("select * from users where id=2") 

1L 

>>> cur.fetchone() 

(2L, u'mypython', u'123456', U'python@gmail.com') 


从 操作 中 可 以 看 出 ， 已 经 将 数据 库 中 第 二 条 的 用 户 名 修改 为 
mypython 了， 用 的 融 是 update 语 句 。 


不 过 ， 要 真 的 实现 在 数据 库 中 的 更 新 ， 还 要 运行 : 











>>> conn.commit() 





还 有 个 小 尾巴 ， 即 当 你 操作 数据 完毕 ， 不 要 起 记 关 门 : 


>>> cur.close() 
>>> conn.close() 


门 锁 好 了 ， 放 心 离开 。 


7.4 MongoDB 数 据 库 





MongoDB 开 始 火 了 ， 这 是 时 代 发 展 的 需要 。 为 此 ， 在 这 里 也 探讨 


一 下 如 何 用 Python 来 操作 此 数据 库 。 考 虑 到 读者 对 这 种 数据 库 的 了 解 可 
能 比 关 系 型 数据 库 陌 生 ， 所 以 ， 要 用 多 一 点 的 篇 幅 来 介绍 。 


mongodb 是 属于 NoSql 的 。 





NoSql (Not Only Sql) 指 的 是 非 关 系 型 的 数据 库 。 它 是 为 了 大 规模 


Web 应 用 而 生 的 ， 其 特征 诸如 模式 目 由 、 文 持 简 易 复 制 、 简 单 的 API、 


大 容 


量 数据 等 。 


MongoDB 是 NoSql 之 一 ， 选 择 它 ， 主 要 是 因为 我 喜欢 ， 下 面 说 说 它 


的 特点 : 


面 问 文档 存储 
对 任何 属性 可 索引 
复制 和 高 可 用 性 
目 动 分 片 
丰富 的 查询 
快速 就 地 更 新 


基于 它 的 特点 ， 擅 长 的 领域 在 于 : 


大 数据 〈 太 时 墅 了 ! 以 下 都 可 以 不 看 ， 有 这 么 一 条 就 足够 了 ) 
内 容 管理 和 交付 

移动 和 社交 基础 设施 

用 户 数据 管理 

数据 平台 








7.4.1 安装 MongoDB 


先 演示 在 Ubuntu 系统 中 的 安装 过 程 : 


sudo apt-key adv --keyserver hkp://keyserver.ubuntu.com:80 --recv 7FOCEB10 

echo 'deb http://downloads-distro.mongodb.org/repo/ubuntu-upstart dist 10gen' | sud 
sudo apt-get update 

sudo apt-get install mongodb-10gen 


如 此 就 安 六 完了 。 安 六 流程 可 以 参考 : 


http://docs.mongodb.org/manual/tutorial/install-mongodb-on-ubuntu/。 


如 果 你 用 的 是 其 他 操作 系统 ， 可 以 到 官方 网 站 下 载 安装 程序 : 
http://www.mongodb.org/downloads， 该 网 站 能 满足 各 种 操作 系统 。 


如 要 在 安装 过 程 中 过 到 了 了 问题， 建议 去 间 Google 大 和 神 如果 有 读者 
心 存疑 虑 或 者 愤愤 不 平 ， 请 不 要 发 怒 ， 这 是 我 的 个 人 建议 ， 不 同意 可 以 
略 过 ， 我 当然 也 尊重 读者 的 个 人 选择 ) 。 








7 水 .局 动 


安装 完毕 就 可 以 启动 数据 库 了 。 因 为 本 书 不 是 专门 讲 数 据 库 的 ， 所 
以 这 里 不 涉及 数据 库 的 详细 讲解 ， 下 面 只 是 建立 一 个 简单 的 库 ， 并 且说 
明 MongoDB 的 基本 要 点 ， 目 的 在 于 为 后 面 用 Python 来 操作 它 做 个 铺垫。 


执行 mongo 启 动 shell， 显 示 的 也 是 “>”， 有 点 类 似 mysqgl 的 状态 。 在 
shell 中 ， 可 以 实现 与 数据 库 的 交互 操作 。 


在 shell 中 ， 有 一 个 全 局 变量 db， 使 用 哪个 数据 库 ， 哪 个 数据 库 就 会 
被 复制 给 这 个 全 局 变量 tb， 如 宁 那 个 数据 库 不 存在 ， 就 会 新 建 。 








> use mydb 

switched to db mydb 
> db 

mydb 





除非 同 这 个 数据 库 中 增加 实质 性 的 内 容 ， 人 否则 它 是 看 不 到 的 。 


> Show dbs; 
local 0.03125GB 


问 这 个 数据 库 增 加 点 东西 。MongoDB 的 基本 单元 是 文 要 ， 所 谓 文 
档 ， 类 似 于 Python 中 的 字典 ， 以 键 值 对 的 方式 保存 数据 。 





> book = {"title":"from beginner to master", "author":"qiwsir", "lang":"python"} 
"title" : "from beginner to master", 
"author™ : "qiwsir", 
"Jang" : "python" 


> db.books.insert(book) 
> db.books.find 
{ "_id" : ObjectId("554fOe3cf579bcO767db9edf"), "title" : "from beginner to master" 


db 指 同 了 数据 库 mydb，books 是 这 个 数据 库 里 面 的 一 个 集合 (类 似 
mysql 里 面 的 表 ) ， 辣 集合 books 里 面 插入 了 一 个 文档 (文档 对 应 mysql 
里 面 的 记录 ) 。“ 数 据 库 、 集 合 、 文 档 ” 构 成 了 mongodb 数 据 库 。 


从 上 面 的 操作 还 发 现 一 个 有 意思 的 地 方 ， 并 没有 类 似 create 之 类 的 
命令 ， 用 到 数据 库 ， 就 通过 use xxx 操 作 ， 如 果 不 存 在 就 建立 ; 用 到 集 
合 ， 就 通过 db.xxx 来 使 有 用， 如果 没有 束 建 立 。 可 以 总 结 为 “ 随 用 随 取 随 建 
了”。 是 不 是 简单 的 有 点 出 人 意料 ? 














> show dbs 
Jocal 0.03125GB 
mydb 0.0625GB 





当 有 了 充实 内 容 之 后 ， 会 看 到 刚才 用 到 的 数据 库 mydb。 

在 shell 中 ， 可 以 对 数据 施 以 “增删 改 查 ”等 操作 。 但 是 ， 我 们 的 目的 
是 用 Python 来 操作 ， 所 以 ， 还 是 把 力气 放 在 后 面 用 。 
7.4.3 ”安装 pymongo 

要 用 Python 来 驱动 MongoDB， 必 须要 安装 驱动 模块 ， 即 pymongo， 
这 跟 操 作 mysql 类 似 。 安 装 方 法 推荐 如 下 : 


$ sudo pip install pymongo 





如 宁 顺 利 ， 就 会 看 到 最 后 的 提示 : 


Successfully installed pymongo 
Cleaning up... 


在 写本 书 的 时 候 ， 安 装 厂 本 号 如 下 ， 如 果 读 者 的 版 本 不 一 样 ， 也 无 
碍 。 


>>> import pymongo 
>>> pymongo.version 
'3.0.1" 


如 果 读 者 要 指定 版 本 ， 比 如 安装 2.8 版 本 的 ， 可 以 : 


$ sudo pip install pymongo==2.8 


安装 好 之 后 ， 进 入 到 Python 的 交互 模式 : 


>>> import pymongo 


说 明 模 块 没 有 问题 。 
7.4.4 连接 MongoDB 


既然 Python 驱 动 MongDB 的 模块 pymongo 业 已 安 装 完毕 ， 接 下 来 就 
是 连接 ， 即 建立 连接 对 象 。 


>>> pymongo.Connection("localhost",27017) 
Traceback (most recent call last): 
File "<stdin>", line 1, in <module> 
AttributeError: 'module' object has no attribute 'Connection' 





报错 ! 我 在 写 这 本 书 之 前 做 项 目 时 ， 就 是 按照 上 面 的 方法 链接 的 ， 
读者 可 以 但 一 下 ， 会 及 现 很 多 教程 都 是 这 么 连接 的 。 但 是 ， 了 眼睁睁 地 看 
到 了 报错 。 

所 以 ， 一定 要 注意 这 里 的 坑 。 


如 果 读 者 用 的 是 旧版 本 的 pymongo， 比 如 2.8 版 本 ， 仍 然 可 以 使 用 上 
面 的 连接 方法 ， 如 条 是 像 我 一 样 用 的 新 版 本 ， 就 得 注意 这 个 问题 了 。 


经 验 主义 害 死 人 。 必 须 看 看 下 面 有 哪些 方法 可 以 用 : 


>>> dir(pymongo) 
['ALL', 'ASCENDING', 'CursorType', 'DESCENDING', 'DeleteMany', 'DeleteOne', 'GEO2D' 








瞪 大 我 的 那 双 浑浊 迷 范 、 布 满 血丝 、 泡 望 惊喜 的 眼睛 ， 透 过 近视 锁 
的 玻璃 片 ， 怎 么 也 找 不 到 Connection() 这 个 方法 。 原 来 ， 刚 刚 安 装 的 
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不 过 ， 我 发 现 了 MongoClient()， 这 是 一 个 峰回路转 的 发 现 。 





>>> client = pymongo.MongoClient("localhost", 27017) 
很 好 ，Python 已 经 和 MongoDB 建 立 了 连接 。 


刚才 已 经 建立 了 一 个 数据 库 mydb， 并 且 在 这 个 库 里 面 有 一 个 集合 
books， 于 是 : 





>>> db = client.mydb 


或 者 : 


>>> db = client['mydb'] 





获得 数据 库 mydb， 并 赋值 给 变量 db (这 个 变量 不 是 MongoDB 的 
shell 中 那个 db， 此 处 的 db 就 是 Python 中 一 个 寻常 的 变量 ) 。 


>>> db.collection_names() 
[u'system.indexes', u'books'] 


查看 集合 ， 发 现 了 已 经 建立 好 的 那个 books， 于 是 再 获取 这 个 集 
合 ， 并 赋值 给 一 个 变量 books: 





>>> books = db["books"] 


或 者 : 


>>> books = db.books 


接 下 来 ， 就 可 以 操作 这 个 集合 中 的 具体 内 容 了 。 


7.4.5 ”编辑 


刚刚 的 books 所 引用 的 是 一 个 MongoDB 的 集合 对 象 ， 它 跟前 面 学 习 
过 的 其 他 对 象 一 样 ， 有 一 些 方法 供 我 们 来 驱使 。 
>>> type(books ) 
<class 'pymongo.collection.Collection'> 


>>> dir(books) 


['_BaseObject_ codec options', '_BaseObject read preference', '_BaseObject write_ 
这 么 多 方法 不 会 一 一 介绍 ， 只 是 按照 “增删 改 碍 ”的 常用 功能 介绍 几 


种 。 读 者 可 以 使 用 help0 去 查看 每 一 种 方 法 的 使 用 说 明 。 


>>> books.find_one() 
{u'lang': u'python', u'_id': ObjectId('554foe3cf579bc0767db9edf ' )，U'author': U' qiw 








提醒 读者 注意 的 是 ，MongoDB 的 shell 中 的 命令 与 pymongo 中 的 方法 
有 时 候 会 稍 有 差别 ， 应 务必 小 心 。 比 如 刚才 这 个 ， 在 shell 中 是 这 样子 
的 ; 


> db.books.findone() 


{ 
"_id" : ObjectId("554fOe3cf579bc0767db9edf"), 
"title" : "from beginner to master", 
"author™ : "qiwsir", 
"Jang" : "python" 
} 
请 注意 区 分 。 


目前 在 集合 books 中 有 一 个 文档 ， 还 想 再 增加 ， 于 是 就 进入 到 了 “ 增 
删改 僵 ” 的 常规 操作 。 
1. 新 增 和 查询 


>>> b2 = {"title":"physics", "author":"Newton", "lang":"english"} 
>>> books.insert(b2) 


ObjectId('554f28f465db941152e6df8b ' ) 





成 功 地 疝 集合 中 增加 了 一 个 文档 。 得 看 看 结果 (我 们 就 是 充满 好 奇 
心 的 小 孩子 ， 记 得 女儿 小 时 候 ， 每 次 给 她 照相 ， 每 拍 一 张 ， 她 总 要 看 一 
看 。 看 看 就 是 一 种 查询 。 











>>> books.find().count() 
2 


这 是 查看 当前 集合 有 多 少 个 文档 的 方式 ， 返 回 值 为 2， 则 说 明 有 两 
条 文档 了。 还 是 要 看 看 内 容 。 





>>> books.find_one() 
{u'lang': u'python', u'_id': ObjectId('554fOe3cf579bcO767db9edf'), u'author': u'qiw 


这 个 命令 就 不 行 了 ， 因 为 它 只 返回 第 一 条 。 必 须要 : 


>>> for i In books.find(): 
print i 


{tu'lang': u'python', u'_id': ObjectId('554fOe3cf579bcO767db9edf'), u'author': U'dqiw 
{u'lang': u'english', u'title': u'physics', u'_id': ObjectId ('554f28f465db941152e6 


在 books 引 用 的 对 象 中 有 findO 方 法 ， 它 返回 的 是 一 个 可 迭代 对 象 ， 
包含 着 集合 中 所 有 的 文档 。 


由 于 文档 是 “ 键 / 值 ? 对 ， 不 一 定 每 条 文档 都 要 结构 一 样 ， 比 如 ， 也 可 
以 在 集合 中 插入 这 样 的 文档 。 








>>> books.insert({"name":"Hertz"}) 
ObjectId( '554f2b4565db941152e6df8c ' ) 
>>> for i in books.find(): 

print i 


{u'lang': u'python', u'_id': ObjectId('554foe3cf579bc0767db9edf ' )，U'author': U' qiw 


{tu'lang': u'english', u'title': u'physics', u'_id': ObjectId ('554f28f465db941152e6 
{u'_id': ObjectId('554f2b4565db941152e6df8c'), u'name': uU'Hertz'} 


如 果 有 多 个 文档 ， 想 一 下 子 部 插入 到 集合 中 在 MySQL 中 ， 可 以 
实现 多 条 数据 用 一 条 命令 插入 到 表 里 面 ) ， 可 以 这 么 做 : 





>>> ni = {"title":"java", "name":"Bush"} 
>>> n2 = {"title":"fortran", "name":"John Warner Backus"} 
>>> n3 = {"title":"lisp", "name":"John McCarthy"} 


>>> n = [ni, n2, n3] 


>>> n 
[{'name': 'Bush', "title': 'java'}, {'name': 'John Warner Backus', title': 'fortra 
>>> books.insert(n) 

[ObjectId('554f30be65db941152e6df8d'), ObjectId('554f30be65db941152e6df8e'), Object 


这 样 就 完成 了 所 谓 的 批量 插入 ， 碍 看 一 下 文档 条 数 : 


>>> books.find().count() 
6 


要 提醒 读者 ， 批 量 插入 的 文档 的 大 小 是 有 限制 的 ， 有 人 说 不 要 超过 
20 万 条 ， 也 有 人 说 不 要 超过 16MB， 但 我 没有 测试 过 。 在 一 般 情况 下 ， 
或 许 达 不 到 上 限 ， 如 果 遇 到 极端 情况 ， 束 请 读者 在 使 用 时 多 注意。 


如 果 要 查询 ， 除 了 通过 循环 之 外 ， 能 不 能 按照 某 个 条 件 查 呢 ?” 比 如 
查找 mame'='Bush' 的 文档 : 








>>> books.find_one({"name":"Bush"}) 
{u'_id': ObjectId('554f30be65db941152e6df8d'), u'name': u'Bush', u'title': u'java'} 


对 于 查询 结果 ， 还 可 以 进行 排序 : 


>>> for i In books.find().sort("title", pymongo.ASCENDING): 
print i 


{u'_id': ObjectId('554f2b4565db941152e6df8c'), u'name': uU'Hertz'} 

{u'_id': ObjectId('554f30be65db941152e6df8e'), u'name': U'John Warner Backus', u'ti 
{u'llang': u'python', u'_id': ObjectId('554fOe3cf579bcO767db9edf'), u'author':; uyu'qiw 
{u'_id': ObjectId('554f30be65db941152e6df8d'), u'name': u'Bush', u'title': u'java'} 
{u'_id': ObjectId('554f30be65db941152e6df8f'), u'name': U'John McCarthy', u'title': 
{u'lang': u'english', u'title': u'physics', u'_id': ObjectId ('554f28f465db941152e6 


这 是 按照 "title" 的 值 的 升序 排列 的 ， 注 意 sort0 中 的 第 二 个 参数 ， 意 
思 是 升序 排列 。 如 果 按 照 降序 ， 就 需要 将 参数 修改 为 
pymongo.DESCEDING， 也 可 以 指定 多 个 排序 键 。 


>>> for i In 
books.find().sort([("name",pymongo.ASCENDING), ("name",pymongo.DESCENDING)]): 
print i 


{u'_id': ObjectId('554f30be65db941152e6df8e'), u'name': U'John Warner Backus', u'ti 
{u'_id': ObjectId('554f30be65db941152e6df8f'), u'name': U'John McCarthy', u'title': 
{u'_id': ObjectId('554f2b4565db941152e6df8c'), u'name': uU'Hertz'} 

{u'_id': ObjectId('554f30be65db941152e6df8d'), u'name': u'Bush', u'title': u'java'} 
{u'llang': u'python', u'_id': ObjectId('554fOe3cf579bcO767db9edf'), u'author': uyu'qiw 
{u'lang': u'english', u'title': u'physics', u'_id': ObjectId ('554f28f465db941152e6 


如 果 读 者 看 到 这 里 ， 请 务必 注意 ，MongoDB 中 的 每 个 文档 ， 本 质 
上 都 是 “ 键 / 值 ?对 的 类 字典 结构 。 这 种 结构 ， 一 经 Python 读 出 来 ， 就 可 以 
用 字典 中 的 各 种 方法 来 操作 。 与 此 类 似 的 还 有 一 个 名 为 json 的 东西 ， 但 
是 ， 用 Python 该 过 来 之 后 ， 无 法 直接 用 json 模 块 中 的 json.dumps() 方 法 操 
作文 档 。 其 中 一 种 解决 方法 就 是 将 文档 中 的 "id' 键 / 值 对 删除 〈 例 如 : del 
doc[' id]) ， 然 后 使 用 json.dumpsO 即 可 。 读 者 也 可 使 用 json_util 模 块 ， 
因为 它 是 “Tools for using Python's json module with BSON documents”， 
请 阅读 http://api.mongodb.org/python/current/api/bson/json_util.html 中 的 模 
块 使 用 说 明 。 





2. 更 新 


对 于 已 有 数据 ， 更 新 是 数据 库 中 常用 的 操作 。 比 如 ， 要 更 新 name 为 
Hertz 那 个 文档 : 








>>> books.update({"name":"Hertz"}, {"$set": { title": "new physics", "author":"Hertz 
{u'updatedExisting': True, u'connectionId': 4, u'ok': 1.0, u'err': None, u'n': 1} 
>>> books.find_one({"author":"Hertz"}) 

{u'title': u'new physics', u'_id': ObjectId('554f2b4565db941152e6df8c'), u'name': U 


在 更 新 的 时 候 ， 用 了 一 个 $set 修 改 器 ， 它 可 以 用 来 指定 键 值 ， 如 采 
键 不 存在 ， 就 会 创建 。 


关于 修改 器 ， 不 仅仅 是 这 一 个 ， 还 有 别 的 呢 ， 如 表 7-1 所 示 。 
表 7-1 ”修改 器 


修改 器 描 述 
Sset 用 来 指定 一 个 键 的 值 。 如 果 不 存在 则 创建 它 
Sunset 完全 删除 某 个 键 
$inc 增加 已 有 键 的 值 ， 不 存在 则 创建 〈 只 能 用 于 增加 整数 、 长 整数 、 双 精度 浮 点 数 ) 
S$push 数组 修改 器 只 能 操作 值 为 数组 ， 存 在 key 则 在 值 末尾 增加 一 个 元 素 ， 不 存在 则 创建 一 个 数组 























3. 删 除 


删除 可 以 用 remove() 方 法 ， 稍 一 演示 ， 读 者 必 会 。 





>>> books.remove({"name":"Bush"}) 
{Uu'connectionId': 4, u'ok': 1.0, u'err': None, u'n': 1} 
>>> books.find_one({"name":"Bush"}) 


>>> 


这 是 将 那个 文档 全 部 删除 。 当 然 ， 也 可 以 根据 MongoDB 的 语法 规 
则 写 个 条 件 ， 按 照 条 件 删 除 。 
.索引 


索引 的 目的 是 为 了 证 查询 速度 更 快 ， 当 然 ， 在 具体 的 项 目 开发 中 ， 
古人 否 建立 索引 要 视 情 况 而 定 ， 因 为 建立 索引 也 是 有 代价 的 。 








>>> books.create_index([("title", pymongo.DESCENDING), ]) 
u'title -1' 


这 里 仅仅 是 对 pymongo 模 块 做 了 一 个 非常 简单 的 介绍 ， 在 实际 使 用 
过 程 中 ， 上 面 的 知识 是 很 有 限 的 ， 所 以 需要 读者 根据 具体 应 用 场景 再 结 
合 MongoDB 的 有 关 知 识 去 尝试 新 的 语句 。 





7.5” ”SQLite 数据 库 


SQLite 是 一 个 小 型 的 关系 型 数据 库 ， 它 最 大 的 特点 在 于 不 需要 服务 
器 、 零 配置 。 前 面 的 两 个 数据 库 ， 不 管 是 MySQL 还 是 MongoDB， 都 需 
要 “安装 ”， 安 装 之 后 ， 才 运行 起 来 ， 其 实 是 已 经 有 一 个 相应 的 服务 器 在 
跑 着 呢 。 而 SQLite 不 需要 这 样 ， 首 先 Python 己 经 将 相应 的 驱动 模块 作为 
标准 库 一 部 分 了 ， 只 要 安装 了 Python， 就 可 以 使 用 ， 另 外 ， 它 也 不 需要 
服务 器 ， 可 以 类 似 操作 文件 那样 来 操作 SQLite 数 据 库 文件 。 还 有 一 点 也 
不 错 ，SQLite 源 代码 不 受 版 权限 制 。 


SQLite 也 是 一 个 关系 型 数据 库 ， 所 以 SQL 语 句 也 可 以 在 里 面 使 用 。 
与 操作 MySQL 数 据 库 类 似 ， 对 于 SQLite 数 据 库 也 要 通过 以 下 几 步 。 
建立 连接 对 象 。 


连接 对 象 方法 : 建立 游标 对 象 。 
游标 对 象 方法 : 执行 sql 语 句 。 


7.5 了 建立 连接 对 象 





由 于 SQLite 数 据 库 的 驱动 已 经 在 Python 里 面 了 ， 所 以 ， 只 要 引用 就 
可 以 直接 使 用 。 并 且 在 学 过 MySQL 的 基础 上 ， 理 解 本 节 内 容 就 容易 多 
本 和 


>>> import sqlite3 
>>> conn = sqlite3.connect("23301.db") 


这 样 束 得 到 了 连接 对 象 ， 是 不 是 比 MySQL 连 接 要 简化 了 很 多 呢 。 
在 sqlite3.connect ("23301.db")〉 语句 中 ， 如 有 果 已 经 有 了 那个 数据 库 ， 就 
连接 上 它 ， 如 果 没 有 ， 就 新 建 一 个 。 注 意 ， 这 里 的 路 径 可 以 随意 指定 。 


不 妨 到 目录 中 看 一 看 ， 刚 才 建 立 的 数据 库 文件 是 否 存在 了 。 











/2code$ 1s 23301.db 
23301., db 


I 连接 对 象 建立 起 来 之 后 ， 就 要 使 用 连接 对 象 的 方法 继续 
四 


>>> dir(conn) 
['DataError', 'DatabaseError', 'Error', 'IntegrityError', 'InterfaceError', 'Intern 


7.5.2 ”游标 对 象 


一 步 跟 MySQL 也 类 似 ， 要 建立 游标 对 象 。 


>>> cur = conn,cursor() 





接 下 来 对 数据 库 内 容 进 行 操作 ， 痢 是 用 游标 对 象 方法 来 实现 : 


>>> dir(cur) 
['_class ', '_ delattr ', '_doc ', '_ format ', '_ getattribute ', '__hash 











看 到 熟悉 的 名 称 了 : close()、execute()、executemany()、fetchall()。 


1. 创 建 数 据 库 表 
对 sqlite 数 据 库 ， 以 往 你 熟悉 的 SQL 语句 照样 可 以 使 用 ， 就 如 此 操作 


O 


>>> create_ table = "create table books (title text, author text, lang text) " 
>>> cur.execute(create_ table) 
<sqlite3.Cursor object at 0xb73ed5a0> 


这 样 就 在 数据 库 23301.db 中 建立 了 一 个 表 books， 对 这 个 表 可 以 增加 
数据 了 。 


>>> CUr .execute( 'insert into books values ("from beginner to master", "laoqi", "pyt 
<sqlite3.Cursor object at 0xb73ed5a0> 


为 了 保证 数据 能 够 保存 ， 还 要 如 下 操作 (这 是 多 么 熟悉 的 操作 流程 


和 命令 呀 ) : 


>>> conn.commit() 
>>> cur.close() 
>>> Conn.close( ) 


在 刚才 建立 的 那个 数据 库 中 ， 已 经 有 了 一 个 表 books， 表 中 已 经 有 
了 一 条 记录 。 


存 进 去 了 ， 总 要 看 看 : 


>>> conn = sqlite3,.connect("23301.db") 

>>> cur = conn.cursor() 

>>> cur.execute('select * from books') 
<sqlite3.Cursor object at 0xb73edea0> 

>>> print cur.fetchall() 

[(u'from beginner to master', u'laoqi', u'python')] 


3. 批 量 插入 
多 增加 扣 内 容 ， 以 便于 做 别 的 操作 : 


>>> books = [("first book","first","c"), ("second book","second","c"), ("third book 


批量 插入 : 


>>> CUr ,executemany( "insert into books values (?,?,?)', books) 
<sqlite3.Cursor object at 0xb73edea0> 
>>> conn.commit() 


用 循环 语句 打印 查询 结 采 : 


>>> rows = cur.execute('select * from books') 
>>> for row in rows: 
print row 


(u'from beginner to master', u'laoqi', u'python') 
(u'first book', u'first', u'c') 

(u'second book', u'second', u'c') 

(u'third book', u'second', u'python') 


4. 更 新 
正如 前 面 所 说 ， 在 cur.execute0 中 ， 你 可 以 写 SQL 语 句 来 操作 数据 


>>> cur.execute("update books set title='physics' where author="'first'") 
<sqlite3.Cursor object at Oxb73edea0> 
>>> conn.commit() 





按照 条 件 查 处 来 看 一 看 : 


>>> cur.execute("select * from books where author='first'") 
<sqlite3.Cursor object at Oxb73edea0> 

>>> cur.fetchone() 

(u'physics', u'first', u'c') 


5. 删 除 
在 操作 数据 的 过 程 中 ， 删 除 是 必须 要 掌握 的 。 





>>> CUr ,execute("deJlete from books where author='second'") 
<sqlite3.Cursor object at 0xb73edea0> 
>>> conn.commit() 


>>> cur.execute("select * from books") 

<sqlite3.Cursor object at Oxb73edea0> 

>>> cur.fetchall() 

[(u'from beginner to master', u'laoqi', u'python'), (u'physics', u'first', u'c')] 





在 你 完成 对 数据 库 的 操作 时 ， 一 定 要 关门 才能 走 人 : 


>>> CuUr .close( ) 
>>> Conn.close( ) 





基本 知识 已经 介绍 差不多 了 。 当 然 ， 在 编程 实践 中 ， 或 许 还 会 遇 到 
问题 ， 残 请 读者 多 参考 官方 文档 。 





7.6 ”电子 表格 


一 提 到 电子 表格 ， 可 能 立刻 想到 的 是 Excel。 殊 不 知 ， 电 子 表格 “ 历 
史 悠 入”， 比 Word 要 长 人 多 了 。 根 据 维基 百科 的 记载 整理 一 个 简 史 : 


VisiCalc 是 第 一 个 电子 表格 程序 ， 用 于 苹果 二 号 计算 机 。 由 丹 : 布 李 
元 林 (Dan Bricklin〉 和 鲍 伯 :法 兰 元 斯 顿 (Bob Frankston) 发 展 而 成 ， 
1979 年 10 月 跟着 苹果 二 与 计算 机 推出 ， 成 为 苹果 二 写 计 算 机 上 的 “杀手 
应 用 软件 ”。 


接 下 来 是 Lotus 1-2-3， 由 Lotus Software (美国 莲花 软件 公司 ) 于 
1983 年 起 所 推出 的 电子 表格 软件 ， 在 DOS 时 期 广 为 个 人 计算 机 用 户 所 使 
0 是 一 套 杀手 级 应 用 软件 。 也 是 世界 上 第 一 个 销售 超过 100 万 套 的 软 


然后 微软 也 开始 做 电子 表格 ， 早 在 1982 年 ， 推 出 了 其 第 一 款 电 子 制 
表 软 件 一 Multiplan， 并 在 CP/M 系 统 上 大 获 成 功 ， 但 在 MS-DOS 系 统 
上 ，Multiplan 败 给 了 Lotus 1-2-3。 


1985 年 ， 微 软 推出 第 一 蒜 Excel， 但 它 只 用 于 Mac 系 统 ; 直到 1987 年 
11 月 ， 微 软 的 第 一 款 适 用 于 Windows 系 统 的 Excel 才 诞生 ， 不 过 ， 它 一 出 
来 ， 就 与 Windows 系 统 直 接 捆 绑 ， 由 于 此 后 Windows 大 行 其 道 ， 并 且 
Lotus1-2-3 迟 迟 不 能 适用 于 Windows 系 统 ， 到 了 1988 年 ，Excel 的 销量 超 
过 了 lotus 1-2-3。 


此 后 就 是 微软 的 天 下 了 ，Excel 后 来 又 并 入 了 Office 里 面 ， 成 为 了 


Microsoft Office Excel。 
尽管 Excel 已 经 发 展 了 很 多 代 ， 提 供 了 大 量 的 用 户 界 面 特性 ， 但 它 


仍然 保留 了 第 一 款 电子 制 表 软件 VisiCalc 的 特性 : 行 、 列 组 成 单元 格 ， 
1 与 数据 相关 的 公式 或 者 对 其 他 单元 格 的 绝对 引用 保存 在 单元 格 














由 于 微软 独霸 天 下 ，Lotus 1-2-3 已 经 淡出 了 人 们 的 视线 ， 甚 至 很 多 


人 误 认 为 历史 就 是 从 微软 开始 的 。 


其 实 ， 除 了 微软 的 电子 表格 ， 在 Linux 系 统 中 也 有 很 好 的 电子 表 
格 ，Google 也 提供 了 不 错 的 在 线 电子 表格 。 


从 历史 到 现在 ， 电 子 表格 部 有 很 广泛 的 用 途 。 所 以 ，Python 也 要 操 
作 一 番 电 子 表格 ， 因 为 有 些 数 据 ， 就 是 存在 于 电子 表格 中 。 





7.6.1 openpyl 





openpyl 模 块 是 解决 Microsoft Excel 2007/2010 之 类 版 本 中 扩展 名 是 
Excel 2010 xlsx/xlsm/xltx/xltm 的 文件 的 读 写 的 第 三 方 库 。 
1. 安 装 
安装 第 三 方 库 ， 当 然 用 法 力 无 边 的 pip install。 
$ sudo pip install openpyxl 
如 采 最 终 看 到 了 下 面 的 提示 ， 恭 喜 你 ， 安 装 成 功 。 


Successfully installed openpyxl] jdcal 
Cleaning up... 


2.workbook 和 sheet 


第 一 步 ， 引入 模块 ， 用 下 面 的 方式 : 


>>> from openpyxl1 import Workbook 


接 下 来 用 Workbook0O) 类 里 面 的 方法 展开 工作 : 


>>> wb = Workbook() 


请 回忆 Excel 文 件 ， 如 果 想 不 起 来 ， 束 打开 Excel， 第 一 眼看 到 的 是 


一 个 称 之 为 工作 籍 (workbook) 的 东西 ， 里 面 有 几 个 sheet， 默 认 是 三 
个 ， 当 然 可 以 随意 增删 。 默 认 使 用 第 一 个 sheet。 


>>> ws = wb.active 


在 每 个 工作 籍 中 至 少 有 一 个 sheet， 通 过 这 条 指令 ， 就 在 当前 工作 短 
中 建立 了 一 个 sheet， 并 且 它 是 当前 正在 使 用 的 。 


还 可 以 在 这 个 sheet 后 面 追 加 : 





>>> ws1 = wb.create_sheet() 
甚至 ， 还 可 以 插队 : 
>>> ws2 = wb.create sheet(1) 
在 第 二 个 位 置 插入 了 一 个 sheet。 


在 Excel 文 件 中 一 样 ， 创 建 了 sheet 之 后 ， 默 认 都 是 
以 “Sheet1”、“Sheet2” 的 样子 来 命名 的 ， 然 后 我 们 可 以 给 其 重新 命名 。 
在 这 里 ， 依 然 可 以 这 么 做 。 


>>> ws.title = "python" 





ws 所 引用 的 sheet 对 象 名 字 束 是 "python” 了 。 
此 时 ， 可 以 使 用 下 面 的 方式 从 工作 敌对 象 中 得 到 sheet 


>>> ws01 = wb['python'] #Sheet 和 工作 簿 的 关系 ， 类 似 键 








/ 值 对 的 关系 


>>> ws 1S WwWSO1 
True 


或 者 用 这 种 方式 : 


>>> ws02 = wb.get_sheet_by_name("python") 
>>> ws is ws02 


True 


整理 一 下 到 目前 为 止 我 们 已 经 完成 的 工作 : 建立 了 工作 籍 (wb) 
和 三 个 sheet。 还 是 显示 一 下 比较 好 : 


>>> print wb.get_sheet_names() 
['python', 'Sheet2', 'Sheet1'] 





Sheet2 之 所 以 排 在 了 第 二 位 ， 是 因为 在 建立 的 时 候 ， 用 了 一 个 插队 
的 方法 。 这 跟 在 Excel 中 差不多 ， 如 果 Sheet 合 名 了 ， 就 按照 那个 名 字 显 
示 ， 和 否则 就 默认 为 名 字 是 "Sheet1" (注意 ， 第 一 个 字母 大 写 ) 。 


也 可 以 用 循环 语句 ， 把 所 有 的 sheet 名 字 打 印 出 来 。 


>>> for sh In wb: 
print sh.title 

python 

Sheet2 

Sheet1 


如 果 读 者 去 dir (wb) 工作 敌对 象 的 属性 和 方法 ， 会 发 现 它 具有 过 
代 的 特征 _ iter_ 方法， 这 说 明 工 作 短 是 可 迭代 的 。 
3.cell 


为 了 能 够 清楚 地 理解 填 数 据 的 过 程 ， 将 电子 表 中 约定 的 名 称 以 图 7- 
1 的 方式 说 明 : 


对 于 Sheet， 其 中 的 cell 是 它 的 下 级 单位 。 所 以 ， 要 得 到 茶 个 cell 可 以 
这 样 : 


b4 = ws['B4'] 





如 果 B4 这 个 cell 已 经 有 了 ， 用 这 种 方法 就 是 将 它 的 值 赋 给 了 变量 
b4; 如 果 sheet 中 没有 这 个 cell， 那 么 就 创建 这 个 cell 对 象 。 








B4 M 五 | this is a cell 
息 B Ss D E F G 


I 


this is a cell 
Tt-is B4 


4 
5 
6 
yf 
8 
局 


10 坚 让 方 同 (纵向) 沪 : 
11 column 


一 = 才 苗 [] 和 为] :TOV 
































图 7-1 ”电子 表 中 约定 的 名 称 


请 读者 注意 ， 当 我 们 打开 Excel， 默 认 已 经 男 好 了 很 多 cell。 但 是 ， 
在 Python 操作 的 电子 表格 中 ， 不 会 默认 男 好 那样 一 个 表格 ， 一 切 都 要 创 
建 之 后 才 有 。 所 以 ， 如 果 按 照 前 面 的 操作 流程 ， 上 面 就 是 创建 了 B4 这 个 
cell， 并 且 把 它 作为 一 个 对 象 被 b4 变 量 引用 。 


如 果 要 给 B4 添 加 数据 ， 可 以 这 么 做 : 








>>> ws['B4'] = 4444 


Se 六 cell 对 象 ， 所 以 可 以 利用 这 个 对 象 的 属性 来 得 看 


>>> b4.value 
4444 


本 要 获得 (或 者 建立 并 获得 ) 某 个 ce 对象， 还 可 以 使 用 下 面 的 方 
法 : 


>>> al = ws.cell("A1") 


或 者 : 


>>> a2 = ws.cell(row = 2, column = 1) 


刚才 已 经 提 到 ， 在 建立 了 Sheet 之 后 ， cell 再 要 
程序 去 建立 。 上 面 都 是 一 个 一 个 地 建立 ， 能 不 能 一 次 建立 多 个 呢 ? 比如 
类 似 下 面 : 


1AL11B11C1| |A2|B2|c2| |A3|B31Cc31 


就 可 以 如 同 切片 那样 来 操作 : 


>>> cells = ws["A1":"C3"] 


可 以 用 下 面 的 方法 奏 看 创建 结 


>>> tuple(ws.iter_rows("A1i:C3")) 

((<Cell python.A1i>, <Cell python.B1>, <Cell python.c1>), 
(<Cell python.A2>, <Cell python.B2>, <Cell python.c2>), 
(<Cell python.A3>, <Cell python.B3>, <Cell] python.c3>)) 


这 是 按照 横向 顺序 读 过 来 的 ， 即 A1-B1-C1， 作 为 一 个 元 组 ， 然 后 
读 下 一 行 ， 再 组 成 一 个 元 组 。 还 可 以 用 下 面 的 循环 方法 ， 一 个 一 个 地 读 
到 每 个 cell 对 象 : 


>>> for row in ws.iter_rows("A1:C3"): 
for cell in row: 
print cell 


<Cell python.A1> 
<Cell python ,B1> 
<Cell python ,CT1> 
<Cell python.A2> 
<Cell python.B2> 
<Cell python.c2> 
<Cell python.A3> 
<Cell python.B3> 
<Cell python.c3> 


也 可 以 用 Sheet 对 象 的 rows 属 性 ， 得 到 按照 横 癌 顺序 依次 排列 的 cell 
对 象 〈 注 意 观 察 结 果 ， 因 为 没有 进行 范围 限制 ， 所 以 目前 是 sheet 中 所 有 
的 cell， 前 面 已 经 建立 到 第 四 行 B4， 所 以 ， 要 比 上 面 的 操作 多 一 个 


row) : 





>>> ws .rows 

((<Cell python.A1>, <Cell python.B1>, <Cell python.c1>), 
(<Cell python.A2>, <Cell python.B2>, <Cell python.c2>), 
(<Cell python.A3>, <Cell python.B3>, <Cell python.c3>), 
(<Cell python.A4>, <Cell python.B4>, <Cell python.c4>)) 


用 sheet 对 象 的 columns 属 性 ， 得 到 的 是 按照 纵 同 顺序 排列 的 cell 对 象 
(注意 观察 结果 ) : 


>>> WwWS,.ColLumns 

((<Cell python.A1>，<Cel1 python.A2>, <Cell python.A3>, <Cell python.A4>), 
(<Cell python.B1i>, <Cell python.B2>, <Cell python.B3>, <Cell python.B4>), 
(<Cell python.c1i>, <Cell python.c2>, <Cell python.c3>, <Cell python.c4>)) 


不 管用 哪 种 方法 ， 只 要 得 到 了 cell 对 象 ， 接 下 来 就 可 以 依次 赋值 
了 。 比 如 要 在 上 面 的 表格 中 ， 依 次 填写 上 1、2、3、.……. 


>>>1i=1 

>>> for cell in ws.rows: 
cell.value = i 
i += 1 


, Traceback (most recent call last): File "", line 2, in AttributeError: 'tuple' 











报错 了 ， 关 键 是 没有 注意 观察 上 和 面 的 结果 。 元 组 里 面 是 以 元 组 为 元 
素 ， 册 里面 才 是 cell 对 象 。 所 以 ， 必 须要 “时 时 管 醒 ”"， 和 常常 谍 慎 。 





>>> for row in ws.rows: 
for cell in row: 
cell.value = i 
i += 1 


如 此 ， 给 每 个 cell 添 加 了 数据 。 查 看 一 下 ， 不 过 要 换 一 个 属性 : 


>>> for col in ws.columns: 
for cell in col: 
print cell.value 


© 
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虽然 看 着 有 点 不 舒服 ， 但 的 确 达 到 了 前 面 的 有 要 求 。 


4. 保 存 

把 辛苦 工作 的 结果 保存 一 下 吧 。 

>>> Wb. save("23401.x1sx") 

如 果 有 同名 文件 存在 ， 会 覆盖 。 

此 时 ， 可 以 用 Excel 打 开 这 个 文件 ， 看 看 可 视 化 的 结果 : 


LU 
器 
二 co ro 
Dome 


5. 夸 有 取 已 有 文件 
如 琳 已 经 有 一 个 .xlsx 文 件 ， 要 读 取 它 ， 可 以 这 样 做 : 


>>> from openpyxl1 import load workbook 


>>> wb2 = load workbook("23401.xlsx") 
>>> print wb2.get_sheet_names() 
['python', 'Sheet2', 'Sheet1'] 
>>> ws_wb2 = wb2["python"] 
>>> for row in ws_wb2.rows: 
for cell in row: 

print cell.value 


7.6.2 ”其 他 第 三 方 库 


针对 电子 表格 的 第 三 方 库 ， 0 六 openpyxl 之 外 还 有 别 的 ， 
下 面 列 出 几 个 仅 供 参考 ， 使 用 方法 大 同 小 异 


。 Xlsxwriter: 针对 Excel 2010 格 式 ， 如 .xlsx， 官 方 网 站 : 
https://Xlsxwriter.readthedocs.org/， 这 个 官方 文档 写 得 图 文 并 成 。 非 
池 力 了 7: 击 
弟 好 读 。 

下 面 两 个 是 用 来 处 理 .xls 格 式 的 电子 表 表 格 。 

。 xlrd: 网 络 文件 ， 

https://secure.simplistix.co.uk/svn/xlrd/trunk/xlrd/doc/xlrd.html? 


p=4966。 
。 xlwt: 网 络 文件 ，http://xlwt.readthedocs.org/en/latest/。 





通过 前 面 的 学 习 ， 已 经 掌握 了 Python 的 基本 内 容 ， 不 少 读者 可 能 此 
时 已 经 跃 跃 僻 试 ， 迫 切 地 想 用 已 经 掌握 的 技术 去 做 点 什么 。 


本 季 就 是 要 讲 一 些 实战 的 东西 。 


因为 本 书 毕竟 是 一 本 向 初学 者 讲述 Python 的 教程 ， 所 以 在 实战 中 的 
所 有 例子 ， 跟 真正 的 工程 代码 要 求 还 有 一 定 的 差距 ， 比 如 可 能 没有 非常 
优化 ， 或 者 东 些 语句 和 方法 的 使 用 还 需要 进一步 推 项 。 也 盼望 读者 能 够 
指出 不 足 ， 必 改正 。 


其 次 ， 所 谓 " 实 战 ?， 多 少 有 点 纸上谈兵 的 味道 ， 也 就 是 将 某 些 东西 
稍微 颖 探 ， 真 正 深奥 的 东西 还 要 等 读者 在 实际 的 工程 中 去 体会 。 并 且 ， 
也 不 要 寄 和 希望 在 这 里 就 能 蔡 代 实践 工作 。 











第 8 章 ”用 Tornado 做 网 站 





上 网 干什么 ? 登录 东 个 网 站 是 必 不 可 少 的 。 网 站 是 谁 做 的 呢 ? 当然 
是 伟大 的 程序 员 做 的 。 网 站 有 很 多 种 ， 做 网 站 的 方式 方法 也 有 很 多 种 。 
本 章 仪 介 绍 利用 Python 语言 开发 网 站 的 基本 方法 ， 而 且 这 个 网 站 仅 具 有 
最 基本 的 功能 。 或 者 说 ， 这 里 只 是 一 个 做 网 站 的 引子 ， 帮 读者 搭建 一 个 
架子 ， 公 于 里 面具 体 的 内 容 ， 还 需要 读者 在 以 后 的 开发 中 上 自己 创意 。 











8.1 ”为 做 网 站 而 准备 


作为 一 个 程序 员 一 定 要 会 做 网 站 ， 因 为 如 果 被 人 问 及 此 事 ， 而 说 目 
己 不 会 ， 的 确 考 愧 难当 呀 。 所 以 ， 要 讲 一 讲 如 何 做 网 站 。 


首先 ， 为 目 己 准备 一 个 服务 器 。 这 个 要 求 似乎 有 点 儿 过 分 ， 作 为 一 
个 普通 的 、 穷 困 渡 倒 的 程序 员 ， 哪 里 有 钱 来 购买 服务 器 呢 ? 没关系 ， 不 
够 买 服务 器 也 能 做 网 站 ， 可 以 购买 云 服 务 空间 或 者 虚拟 空间 ， 这 个 在 网 
上 搜索 一 下 ， 有 很 多 。 如 果 连 购买 这 个 的 钱 也 没有 ， 还 可 以 将 自己 的 电 
脑 《 这 总 该 有 了 ) 作为 服务 服务 器 。 我 就 是 利用 一 全 装 有 Ubuntu 操作 系 
统 的 个 人 电脑 作为 本 书 的 案例 演示 服务 器 。 


然后 ， 要 在 这 个 服务 器 上 做 一 些 程序 配置 。 一 些 必 备 的 网 络 配置 这 
里 束 不 说 了 ， 比 如 我 用 的 Ubuntu 系统 ， 默 认 情 况 都 有 了 。 必 外 的 配置 束 


接 下 来 要 安装 一 个 框架 ， 这 里 及 用 Tornado 框 染 。 在 安装 这 个 框架 
之 前 ， 先 了 解 一 些 相 关 知识 。 








8.1.1 开发 框架 


对 框架 的 认识 ， 由 于 工作 习惯 和 工作 内 容 的 不 同 ， 会 有 很 大 差异 ， 
这 里 姑且 稚 取 维基 百科 中 的 一 种 定义 ， 之 所 以 要 给 出 一 个 定义 ， 无 非 是 
让 读者 有 所 了 解 ， 但 是 ， 是 否 知 道 这 个 定义 ， 丝 坚 不 影 响 后 和 面 的 工作 。 


软件 框架 (Software framework) ， 通 常 指 的 是 为 了 实现 某 个 业界 
标准 或 完成 特定 基本 任务 的 软件 组 件 规范 ， 也 指 为 了 实现 某 个 软件 组 件 
规范 时 ， 提 供 规 范 所 要 求 之 基础 功能 的 软件 产品 。 


框架 的 功能 类 似 于 基础 设施 ， 与 具体 的 软件 应 用 无 关 ， 但 是 提供 并 
实现 最 为 基础 的 软件 架构 和 体系 。 软 件 开 发 者 通常 依据 特定 的 框架 实现 
更 为 复杂 的 商业 运用 和 业务 逻辑 。 这 样 的 软件 应 用 可 以 在 支持 同一 种 框 





架 的 软件 系统 中 运行 。 





简 而 言 之 ， 框 架 就 是 制定 一 套 规范 或 者 规则 《思想 ) ， 大 家 《程序 


员 ) 在 该 规范 或 者 规则 (思想 ) 下 工作 。 就 好 比 使 用 别人 搭 好 的 舞台 ， 
你 来 做 表演 。 


我 比较 喜欢 最 后 一 句 解释 “别人 搭 好 舞 合 ， 我 来 表演 ”。 这 也 就 是 





说 ， 在 做 软件 开发 的 时 候 ， 能 够 减少 工作 量 。 就 做 网 站 来 讲 ， 其 实 需要 
J 但 是 如 果 有 了 开发 框 淋 ， 很 多 底层 的 事情 就 不 需要 做 








有 些 局 手工 程 师 鄙 视 框 染 ， 认 为 自己 编写 的 才 是 王道 。 在 这 方面 不 


框架 是 开发 中 很 流行 的 东西 ， 我 还 是 固执 地 认为 用 框架 来 开发 更 
省 科 


8.1.2 Python 框架 


有 人 说 PHP 框 架 多 ，PHP 的 开发 框架 的 确 很 多 ， 不 过 ，Python 的 


Web 开 友 框 架 ， 也 足够 使 用 了， 列举 几 种 第 见 的 Web 框 染 : 


Django: 这 是 一 个 被 广泛 应 用 的 框架 。 在 网 上 搜索 ， 会 发 现 很 多 公 
司 在 招聘 的 时 候 都 要 求 会 这 个 。 框 架 只 是 辅助 ， 真 正 的 程序 员 ， 应 
该 根据 需要 而 做 。 当 然 不 同 的 框架 有 不 同 的 特点 ， 需 要 学 习 一 段 时 
间 。 

Flask: 一 个 用 Python 编写 的 轻 量 级 Web 应 用 框架 。 基 于 Werkzeug 
WSGI 工 具 箱 和 Jinja2 模 板 引 擎 。 

Web2py: 是 一 个 为 Python 语 言 提 供 的 全 功能 Web 应 用 框架 ， 则 在 敏 
捷 快 速 地 开发 Web 应 用 ， 具 有 快速 、 安 全 以 及 可 移植 的 数据 库 驱 动 
的 应 用 ， 兼 容 Google App Engine。 














。 Bottle: 微型 Python Web 框架， 遵循 WSGI， 说 其 微型 ， 是 因为 它 只 





有 一 个 文件 ， 除 Python 标准 库 外 ， 它 不 依赖 于 任何 第 三 方 模块 。 


。 Tornado: 全 称 是 Tomado Web Server， 从 名 字 上 看 就 知道 它 可 以 用 


来 。 
。 Webpy: 轻 量 级 的 Python Web 框 架 。webpy 的 设计 理念 力求 精简 


作 Web 服 务 器 ， 但 同时 它 也 是 一 个 Python Web 的 开发 框架 。 最 初 是 
在 FriendFeed 公 司 的 网 站 上 使 用 ，FaceBook 收 购 了 之 后 便 开源 了 出 


下 


主 入 全 





(Keep it simple and powerful) ， 源 码 很 简短 ， 只 提供 一 个 框架 所 
必需 的 东西 ， 不 依赖 大 量 的 第 三 方 模块 ， 它 没有 URL 路 由 、 没 有 模 
板 也 没有 数据 库 的 访问 。 


以 上 信息 选 自 : http://blog.jobbole.com/72306/， 在 这 篇 文章 中 还 有 
别 的 框架 ， 由 于 不 是 Web 框 架 ， 所 以 没有 选 摘 ， 有 兴趣 的 读者 可 以 去 阅 


读 。 





8.1.3 Tornado 


本 教程 中 将 选择 使 用 Tornado 框 架 。 


Tornado 全 称 Tornado Web Server， 是 一 个 用 Python 语言 写成 的 Web 
服务 器 兼 web 应 用 框架 ， 由 FriendFeed 公 司 在 自己 的 网 站 FriendFeed 中 使 
用 ， 被 Facebook 收 购 以 后 框架 以 开源 软件 的 形式 开放 给 大 众 。 


一 般 用 哪个 框架 要 结合 项 目 而 定 。 我 选用 Tornado 的 原因 ， 就 是 看 
中 了 它 在 性 能 方面 的 优异 表现 。 

Tornado 的 性 能 是 相当 优 寞 的 ， 因 为 它 试 图 解决 一 个 被 称 之 
为 “C10k" 问 题 ， 就 是 处 理 大 于 或 等 于 一 万 的 并 发 。 


如 表 8-1 所 示 是 和 一 些 其 他 Web 框 架 与 服务 器 的 对 比 ， 供 读者 参考 
(数据 来 源 : https://developers.facebook.com/blog/post/301) 。 








条 件 : 处 理 器 为 AMD Opteron， 主 频 2.4GHz，4 核 。 


























表 8-1 他 Web 框 架 与 服务 器 的 对 比 


部 署 





nginx，4 进程 





1 个 单线 程 进程 


Apache/mod wsgi 








Apache/mod wsgi 


独立 














看 了 这 个 对 比 表格 ， 还 有 什么 理由 不 选择 Tornado 呢 ? 


影响 一 个 网 站 性 能 的 因素 ， 不 完全 在 于 框架 ， 还 有 别 的 因素 ， 上 面 
的 比较 仅 供 参考 。 


8.1.4 安装 Tornado 


Tornado 的 官方 网 站 : http:/www.tornadoweb.org。 


我 在 目 己 的 电脑 中 《是 我 目前 使 用 的 服务 器 ) ， 用 下 面 的 方法 安 
装 ， 只 需要 一 句 话 即 可 : 


pip install tornado 


这 是 因为 Tornado 已 经 列 入 PyPI， 因 此 可 以 通过 pip 或 者 easy_install 
来 安装 。 


如 果 不 用 这 种 方式 安装 ， 下 面 的 链接 中 有 可 以 供 读者 下 载 的 最 新 源 
人 码 版 本 和 安装 方式 : https://pypi.python.org/pypi/tornado/。 


此 外 ， 在 github 上 也 有 托管 ， 读 者 可 以 通过 上 述 页 面 进入 到 github 看 
源码 。 


我 没有 在 Windows 操 作 系 统 上 安装 过 这 个 ， 不 过 ， 在 官方 网 站 上 有 
一 句 话 ， 在 告诉 读者 一 些 信息 : 








Tornado will also run on Windows, although this configuration is not officially sup 


特别 建议 ， 在 真正 的 工程 中 ， 网 站 的 服务 器 还 是 用 Linux 比 较 好 。 


最 后 说 明 一 下 ， 要 做 网 站 ， 除 了 做 好 上 述 准 备 之 外 ， 还 要 有 点 别 的 
技术 准备 : 


e HTML 
e CSS 
e JavaScript 


8.2 分析 Hello 


打开 你 写 Python 代 人 码 用 的 编辑 器 ， 把 下 面 的 代码 一 个 字 不 差 地 录入 
进去 ， 并 命名 保存 为 hello.py (目录 自己 任意 定 )。 








#!/UsSr/bin/env python 
#coding:utf-8 


import tornado.httpserver 
import tornado.ioloop 
import tornado,options 
import tornado.web 


from tornado.options import define, options 
define("port", default=8000, help="run on the given port", type=int) 


class IndexHandler(tornado.web.RequestHandler ) : 
def get(self): 
greeting = self.get_argument('greeting', 'Hello') 
self.write(greeting + ', welcome you to read: www.itdiffer.com') 
if name == ”main ": 
tornado.options.parse_ command_line() 
app = tornado.web.Application(handlers=[(r"/", IndexHandler)]) 
http_server = tornado.httpserver.HTTPServer (app) 
http_server.listen(options.port) 
tornado.ioloop.IOLoop.instance().start() 





进入 到 保存 hello.py 文 件 的 目录 ， 执 行 


$ python hello.py 


用 Python 运行 这 个 文件 ， 其 实 就 已 经 发 布 了 一 个 网 站 ， 只 不 过 这 个 
网 站 太 简 单 了 。 诚 然 ， 这 是 有 前 提 的 ， 那 就 是 已 经 按照 上 一 节 的 流程 把 
Tornado 安 装 好 了 。 


接 下 来 ， 打 开 浏 览 器 ， 在 浏览 器 中 输入 : http:/localhost:8000， 得 
到 如 图 8 所 示 的 界面 。 


http://localhost:8000/ x 


© @localhost 


Hello, welcome you to read: www.itdiffer.com 











图 8-1 网 站 界面 
在 Ubuntu 的 shell 中 还 可 以 用 下 面 的 方式 运行 : 


$ curl http://localhost:8000/ 
Hello, welcome you to read: www.itdiffer.com 


$ curl http://localhost:8000/?greeting=Qiwsir 
Qiwsir, welcome you to read: www.itdiffer.com 





此 操作 ， 读 者 可 以 根据 自己 的 系统 而 定 。 


不 管 怎 样 ， 都 要 茶 喜 你 ， 迈 出 了 决定 性 一 步 ， 已 经 可 以 用 Tornado 
发 布 网 站 了 。 在 这 里 似乎 没有 做 什么 部 晋 ， 只 是 安装 了 Tornado。 是 
的 ， 不 需要 多 做 什么 ， 因 为 Tornado 就 是 一 个 很 好 的 server， 也 是 一 个 框 
5 





下 和 面 以 这 个 非常 简单 的 网 站 为 例 ， 对 用 Tornado 做 的 网 站 的 基本 结 
构 进 行 解释 。 


8.2.1 Web 服务 器 工作 流程 


任何 一 个 网 站 都 离 不 开 Web 服 务 器 ， 这 里 所 说 的 不 是 指 那个 跟 计 算 
机 一 样 的 硬件 设备 ， 而 是 指 里 面 安装 的 软件 ， 有 时 候 初 次 接触 的 读者 容 
易 摘 混 。 就 连 伟大 的 维基 百科 都 这 么 说 : 


有 时 ， 两 种 定义 会 引起 混 消 ， 如 Web 服 务 器 ， 它 可 能 是 指 用 于 网 站 
的 计算 机 ， 也 可 能 是 指 像 Apache 这 样 的 软件 ， 运 行 在 这 样 的 计算 机 上 以 


管理 网 页 组 件 和 回应 网 页 浏览 器 的 请 求 。 

在 具体 的 语 境 中 ， 读 者 要 注意 分 析 。 

在 Web 上 ， 用 得 最 多 的 就 是 输入 网 址 ， 访 问 某 个 网 站 。 全 世界 那么 
多 网 站 网 页 ， 如 果 去 访问 ， 怎 么 能 够 做 到 役 此 互通 互联 呢 ? 为 了 协调 彼 
此 ， 制 定 了 很 多 通用 的 协议 ， 其 中 http 协 议 ， 就 是 网 络 协议 中 的 一 种 。 


网 上 有 一 张 图 (http:/kenby.iteye.com/blog/1159621) ， 如 图 8-2 所 
示 ， 简 要 说 明 Web 服 务 器 的 工作 过 程 








socket 


web server 





handle request 











图 8-2 Web 服务器 的 工作 过 程 
为 了 让 读者 能 更 理解 ， 把 原文 中 对 图 示 的 说 明 也 贴 上 : 
1. 创 建 listen socket， 在 指定 的 监听 端口 ， 等 待 客户 端 请 求 的 到 来 。 


2.listen socket 接 受 客户 端的 请 求 ， 得 到 client socket， 接 下 来 通过 
client socket 与 客户 端 通信 。 


3. 处 理 客户 端的 请 求 ， 首 先 从 dient socket 读 取 http 请 求 的 协议 头 ， 





如 果 是 post 协 议 ， 还 可 能 要 读 取 客户 端 上 传 的 数据 ， 然 后 处 理 请 求 ， 准 
备 好 客户 端 需要 的 数据 ， 通 过 client socket 写 给 客户 端 。 


8.2.2 ”解剖 标本 


前 面 跑 起 来 的 那个 网 站 ， 就 算是 一 个 标本 了 ， 分 析 这 个 网 站 ， 能 让 
我 们 对 网 站 的 概况 有 所 了 解 。 


1. 引 入 模块 


Import tornado ,httpserver 
import tornado.ioloop 
import tornado.options 
import tornado.web 





这 四 个 都 是 Tormado 的 模块 ， 在 本 例 中 都 是 必需 的 。 它 们 四 个 在 一 
般 的 网 站 开发 中 ， 都 要 被 用 到 ， 基 本 作用 分 别 如 下 。 


。 tornado.httpserver: 这 个 模块 用 来 解决 Web 服 务 器 的 http 协 议 问题 ， 
它 提 供 了 不 少 属性 方法 ， 实 现 客户 端 和 服务 器 端的 互通 。Tornado 
的 非 阻塞 、 单 线程 的 特点 在 这 个 模块 中 体现 。 

。 tornado.ioloop: 这 个 也 菲 常 重要 ， 实 现 IMO 循 环 ， 监 听 用 户 请 求 ， 然 
后 映射 具体 的 处 理 ， 再 返 给 用 户 相 应 的 结果 。 

。 tornado.options: 这 是 命令 行 解析 模块 ， 也 常用 到 。 

。 tornado.web: 这 是 必 不 可 少 的 模块 ， 它 提供 了 一 个 简单 的 Web 框 架 
了 从 而 使 其 扩展 到 大 量 打 开 的 连接 ， 使 其 成 为 理想 的 长 
已 IJ 角 。 
读者 看 到 这 里 可 能 有 点 真名 其 妙 ， 对 这 些 东 西 不 理解 。 没 关系 ， 你 

可 以 先 不 用 管 它 。 一 定 要 人 硬 着 头皮 一 字 一 句 地 读 下 去 ， 随 着 学 习 和 实践 
的 深入 ， 现 在 不 理解 的 以 后 会 逐渐 领悟 。 
还 有 一 个 模块 引入 ， 是 用 from...import 完 成 的 。 


from tornado.options import define, options 
define("port", default=8000, help="run on the given port", type=int) 


这 两 人 句 束 显示 了 所 请“ 命令 行 解析 模块 "的 用 途 了 。 


通过 tornado.options.define() 定 义 了 访问 本 服务 器 的 端口 ， 就 是 当 在 
浏览 器 地 址 栏 中 输入 http:localhost:8000 的 时 候 ， 才 能 访问 本 网 站 ， 因 为 
http 协 议 默认 的 端口 是 80， 为 了 区 分 ， 在 这 里 设置 为 8000， 为 什么 要 区 
分 呢 ? 因为 我 的 计算 机 已 经 部 普 了 别 的 《或 许 是 Nginx、Apache) 服务 
器 了 ， 它 的 端口 是 80， 所 以 要 区 分 开 ， 并 且 ， 如 采 将 Tornado 和 Nginx 联 
合 起 来 工作 ， 两 个 服务 器 在 同一 台 计 算 机 上 ， 就 要 分 开 (关于 两 者 联合 
工作 ， 可 以 到 网 上 搜索 并 参考 有 头 Tornado 部 蜀 的 资料 )。 








2. 定 义 请 求 -处 理 程序 类 


class IndexHandler(tornado.web.RequestHandler ) : 
def get(self): 
greeting = self.get_argument('greeting', 'Hello') 
self.write(greeting + ', welcome you to read: www.itdiffer.com') 


所 谓 “ 请 求 处 理 * 程 序 类 ， 束 是 要 定义 一 个 类 ， 专 门 应 付 客户 端 向 服 
务 需 提出 的 请 求 〈 这 个 请 求 也 许 是 要 读 取 某 个 网 页 ， 也 许 是 要 将 茶 些 信 
恩人 存 到 服务 器 上 ) ， 服 务 器 要 有 相应 的 程序 来 接收 并 处 理 这 个 请 求 ， 并 
且 反 馈 某 些 信息 (或 者 是 针对 请 求 反 馈 所 要 的 信息 ， 或 者 返回 其 他 的 错 


误 信息 等 )。 








于 是 ， 就 定义 了 一 个 类 ， 名 字 是 IndexHandler， 名 字 可 以 随便 取 ， 
但 是 ， 按 照 习惯 类 名 的 单词 首 字 母 都 是 大 写 的 ， 并 且 如 果 这 个 类 是 请 求 
处 理 程 序 类 ， 那 么 最 好 用 Handler 结 尾 ， 这 样 在 名 称 上 很 明确 ， 望 文生 
义 5 刘 寻 是 干什么 肘 。 


类 IndexHandler 继 承 tornado.web.RequestHandler， 其 中 再 定义 getO0 和 
post() 两 个 在 Web 中 应 用 最 多 的 方法 的 内 容 。 


在 本 例 中 ， 只 定义 了 一 个 get0 方 法 。 














用 greeting=self.get_argument ('greeting'"，'Hello'〉 的 方式 可 以 得 到 
url 中 传递 的 参数 ， 比 如 : 


$ curl http://localhost:8000/?greeting=Qiwsir 
Qiwsir, welcome you to read: www.itdiffer.com 


得 到 了 在 url 中 为 greeting 设 定 的 值 Qiwsir。 如 果 url 中 没有 提供 值 ， 
就 是 Hello。 


官方 文档 对 这 个 方法 的 描述 如 下 : 





RequestHandler.get_argument(name, default=,[ ]strip=True) 
Returns the value of the argument with the given name. 


If default is not provided, the argument is considered to be required, and 
we raise a MissingArgumentError if it is missing. 


If the argument appears in the url more than once, we return the last 
value. 


The returned value is always unicode. 
接 下 来 的 那 句 self.write (greeting+'"，weblcome you to 
Fed www.itdiffer.com ) ' 中 ， RE 的 主要 功能 是 辐 客 户 端 反馈 信 
恩 。 也 浏览 一 下 官方 文档 信息 ， 对 以 后 的 正确 理解 使 用 有 帮助 ; 
ReduestHandler.write(Cchunk)[source] 
Writes the given chunk to the output buffer. 


To write the output to the network,use the flush() method below. 


If the given chunk is a dictionary,we write it as JSON and set the 
Content-Type of the response to be application/json. (if you want to send 
JSON as a different Content-T'ype,call set_header after calling write()). 


3.main() 方 法 


if_name ==" main "这 个 方法 跟 以 往 执 行 Python 程 序 是 一 样 
的 。 


tornado.options.parse_command_line()， 这 是 在 执行 Tornado 的 解析 命 
令 行 。 在 Tornado 的 程序 中 ， 只 要 import 模 块 之 后 ， 束 会 在 运行 的 时 候 自 


动 加 载 ， 不 需要 了 解 细节 ， 但 是 ， 在 main() 方 法 中 如 果 有 命令 行 解 析 ， 
必须 提前 将 模块 引入 。 





4.Application 类 
下 面 这 人 句 是 重点 : 


app = tornado.web.Application(handlers=[(r"/", IndexHandler)]) 


将 tornado.web.Application 类 实例 化 。 这 个 实例 化 ， 本 质 上 是 建立 了 
整个 网 站 程序 的 请 求 处 理 集 合 ， 然 后 它 可 以 被 HITPServer 作 为 参数 调 
用 ， 实 现 http 协 议 服 务 器 访问 。Application 类 的 _init 方法 参数 形式 : 


def _ init (self, handlers=None, default_host="", transforms=None,**settings): 
pass 


在 一 般 情 况 下 ，handlers 是 不 能 为 空 的， 因为 Application 类 要 通过 这 
个 参数 的 值 处 理 来 自 客 户 端 的 请 求 。 例 如 在 本 例 中 ，handlers=[ 《r""， 
IndexHandler) ]， 就 意味 着 如 果 通 过 浏览 器 的 地 址 栏 输入 根 路 径 
(http://localhost:8000 就 是 根 路 径 ， 如 果 是 http://localhost:8000/gqiwsir， 
就 不 属于 根 ， 而 是 一 个 子路 径 或 目录 了 ) ， 对 应 着 就 是 让 IndexHandler 
类 处 理 这 个 请 求 。 


一 定 要 注意 通过 handlers 传 入 的 数值 格式 ， 等 到 后 面 做 复杂 结构 的 
网 站 时 ，handlers 束 显得 重要 了 。 它 传 入 的 是 一 个 列表 ， 列 表 里 面 的 元 
系 是 元 组 ， 元 组 的 组 成 包括 两 部 分 ， 一 部 分 是 请 求 路 径 ， 另 外 一 部 分 是 
处 理 程序 的 类 名 称 。 注 意 请 求 路 径 可 以 用 正则 表达 式 书写 (关于 正则 表 
达 式 ， 后 面 会 进行 简要 介绍 ) 。 举 例 说 明 : 



































handlers = [ 

(r"/", IndexHandlers), # 来 自 根 路 径 的 请 求 
IndesHandlers 处 理 

(r"/qiwsir/(.*)", QiwsirHandlers), # 来 自 


/qiwsir/ 以 及 其 下 任何 请 求 


#QiwsirHandlers 处 理 





在 这 里 我 使 用 了 r"" 的 样式 ， 意 味 着 就 不 需要 使 用 转 义 人 符 ，r 后 面 的 
都 表示 该 符号 本 来 的 含义 。 例 如 ，\n， 如 果 单 纯 这 么 来 使 用 ， 就 意味 着 
换行 ， 因 为 符号 “具有 转 义 功能 ， 当 写成 rn" 的 形式 时 ， 就 不 再 表示 换 
行 了 ， 而 是 两 个 字符 ，\ 和 mn， 不 会 转 意 。 一 般 情 况 下 ， 由 于 正则 表达 式 
Rs 因此 ， 当 一 个 字符 串 使 用 了 正则 表达 式 后 ， 最 好 使 用 此 
To 


关于 Application 类 的 介绍 ， 告 一 段落 ， 还 有 别 的 参数 设置 没有 讲 ， 
请 保持 耐心 继续 阅读 后 续 内 容 。 














5.HTTPServer 类 


实例 化 之 后 ，Application 对 象 ( 用 app 作 为 标签 的 ) 就 可 以 被 另外 一 
个 类 HTTPServer 引 用 ， 形 式 为 : 


http_server = tornado.httpserver.HTTPServer (app) 


HTTPServer 是 tornado.httpserver 里 面 定义 的 类 。HTTPServer 是 一 个 
单线 程 非 阻塞 HTTP 服务 器 ， 执 行 HTTPServer 一 般 要 回调 Application 对 
象 ， 并 提供 发 送 响应 的 接口 ， 即 下 面 的 内 容 是 跟随 上 面 语句 的 

《options.port 的 值 在 IndexHandler 类 前 面 通过 from...import.. 设 置 )。 


http_server.listen(options.port) 
这 种 方法 ， 就 建立 了 单 进程 的 http 服 务 。 
请 读者 牢记 ， 如 果 在 以 后 的 编码 中 ， 遇 到 需要 多 进程 ， 请 参考 官方 


文档 说 明 : http://tornado.readthedocs.org/en/latest/httpserver.html#http- 
SerVer。 





6.IOLoop 类 


剩 下 最 后 一 名 了; 


tornado.ioloop.IOLoop.instance().start() 


这 人 句 话 ， 总 是 在 ”main() ”的 最 后 一 句 。 和 暂时 不 对 这 里 的 instance() 
和 start() 做 深入 研究 (如 果 你 去 研究 start()， 肯 定 会 有 点 突然 的 感觉 


以 上 是 一 个 简单 的 hello.py 剖 析 。 想 必 读 者 对 Tornado 编 写 网 站 的 基 
本 概念 已 经 了 解 了 。 


如 末 还 一 头 筋 水 ， 也 不 要 着 急 ， 只 需要 有 一 个 整体 概念 ， 不 要 拘泥 
于 细节 或 者 某 些 词 汇 含义 ， 然 后 即 继续 学 习 。 

















8.3 ”做 个 简单 的 网 站 


从 现在 开始 做 一 个 网 站 ， 当 然 ， 这 个 网 站 只 能 算是 一 个 毛坯 的 ， 可 
能 很 简陋 ， 但 是 网 站 的 主要 元 素 都 会 涉及 ， 读 者 通过 此 学 习 ， 能 够 了 解 
之 人、 
, 口 


网 站 的 开发 基本 结构 和 内 容 ， 并 且 对 前 面 的 知识 可 以 有 综合 应 用 。 








8.3.1 基本 结构 





如 图 8-3 所 示 是 一 个 网 站 的 基本 结构 。 


提交 数据 





_。 存 入 数据 — -- 
AS 和 请 求 信息 | 
a | 前 请 
数据 库 Pythor 程 序 ne 

















ET 
取出 数据 一 返回 信息 一 一 


图 8-3 ”网 站 的 基本 结构 


1. 前 端 

这 是 一 个 不 很 严格 的 说 法 ， 但 是 在 日 常 开 发 中 都 这 么 说 。 在 网 站 
中 ， 所 谓 前 端 就 是 指 用 浏览 器 打开 之 后 看 到 的 那 部 分 ， 它 呈现 网 站 传 过 
来 的 信息 的 界面 ， 也 是 用 户 和 网 站 之 间 进 行 信 息 交 互 的 界面 。 撰 写 前 
端 ， 一 般 使 用 HTML/CSSJS， 当 然 ， 非 要 用 Python 也 不 是 不 可 以 《例如 
的 例子 就 没有 用 HTML/CSS/JS，， 但 这 势必 造成 以 后 维护 困 
难 。 








MVC 模 式 是 一 个 非常 好 的 软件 架构 模式 ， 在 网 站 开 友 中 ， 也 常 肖 
要 求 遵守 这 个 模式 。 请 阅读 维基 百科 的 解释 : 


MVC 模 式 (Model-View-Controller〉 是 软件 工程 中 的 一 种 软件 架构 
模式 ， 把 软件 系统 分 为 三 个 基本 部 分 : 模型 (Model) 、 视 图 (View) 
和 控制 器 (Controller) 。 


MVC 模 式 最 早 由 Trygve Reenskaug 在 1978 年 提出 ， 是 施乐 帕 罗 奥 多 
研究 中 心 (Xerox PARC) 在 20 世 纪 80 年 代为 程序 语言 Smalltalk 发 明 的 一 
种 软件 设计 模式 。MVC 模 式 的 目的 是 实现 一 种 动态 的 程式 设计 ， 使 后 
续 对 程序 的 修改 和 扩展 简化 ， 并 且 使 程序 某 一 部 分 的 重复 利用 成 为 可 
能 。 除 此 之 外 ， 此 模式 通过 对 复杂 度 的 简化 ， 使 程序 结构 更 加 直观 。 软 
件 系统 通过 对 自身 基本 部 分 分 离 的 同时 也 赋予 了 各 个 基本 部 分 应 有 的 功 
能 。 专 业 人 员 可 以 通过 上 自身 的 专长 分 组 。 


。 控制 器 〈Controller) : 负责 转发 请 求 ， 对 请 求 进行 处 理 。 

。 视图 〈View) : 界面 设计 人 员 进 行 图 形 界面 设计 。 

。 模 型 (Model): 程序 员 编 写 程序 应 有 的 功能 (实现 算法 等 ) 、 数 
据 库 专 家 进行 数据 管理 和 数据 库 设计 《可 以 实现 具体 的 功能 


所 谓 “ 前 端 ”， 大 概 对 应 着 View 部 分 ， 之 所 以 说 是 大 概 ， 因 为 MVC 
征 站 在 一 个 软件 系统 的 角度 进行 划分 的 ， 图 8-2 中 的 前 后 端 ， 与 其 说 是 
系统 部 分 的 划分 ， 不 如 说 是 系统 功能 的 划分 。 


前 端 所 实现 的 功能 主要 有 : 


呈现 内 容 。 这 些 内 容 是 根据 URL， 由 后 端 从 数据 库 中 提取 出 来 的 ， 
发 送 给 前 端 ， 然 后 前 问 将 其 按照 一 定 的 样式 呈现 出 来 。 另 外 ， 有 一 
些 内 容 不 是 后 端 数 据 库 提供 的 ， 是 写 在 前 端的 。 

用 户 与 网 站 交互 。 比 如 用 户 登录 ， 这 是 很 多 网 站 都 有 的 功能 ， 当 用 
户 在 指定 的 输入 框 中 输入 信息 之 后 ， 该 信息 就 是 被 前 病 提 交 给 后 

端 ， 后 端 对 这 个 信息 进行 处 理 ， 一 般 情况 下 都 要 再 反馈 给 前 端 一 个 
处 理 结果 ， 然 后 前 端 呈 现 给 用 户 。 



































2. 后 端 


这 里 所 说 的 后 端 对 应 着 MVC 中 的 Controller 和 Model 的 部 分 或 者 全 部 





功能 ， 因 为 在 图 8-2 中 ,“ 后 端 " 是 一 个 狭隘 的 概念 ， 没 有 把 数据 库 放 在 


不 在 这 些 术语 上 纠结 。 
后 端 束 是 用 Python 写 的 程序 ， 主 要 任务 是 根据 需要 处 理由 前 端 故 过 


来 的 各 种 请 求 ， 然 后 根据 逻辑 流程 操作 数据 库 〈 对 数据 库 进 行 增删 改 
查 ) ， 或 者 把 请 求 的 处 理 结果 反馈 给 前 端 ， 还 可 能 二 者 兼 有 之 。 








3. 数 据 库 
工作 比较 单一 ， 就 是 面 对 后 端的 Python 程序 ， 任 其 增删 改 大 。 


8.3.2 一 个 基本 架势 


我 们 已 经 制作 了 一 个 只 显示 一 行 字 的 网 站 ， 该 网 站 由 于 功能 太 单 
一 ， 把 所 有 的 东西 都 写 到 一 个 文件 中 。 在 真正 的 工程 开发 中 ， 如 果 那 么 
做 ， 那 么 开发 过 程 和 后 期 维护 会 遇 到 麻烦 ， 特 别 是 不 便于 多 人 合作 。 所 
以 ， 要 做 一 个 基本 框架 ， 以 后 网 站 就 在 这 个 框 洪 中 开发 。 


建立 一 个 目录 ， 在 这 个 目录 中 建立 一 些 子 目录 和 文件 。 





让 


handlers 


methods 


statics 


templates 


application.py 


server.py 


| 
url.py 


这 个 结构 建立 好 ， 就 摆 开 了 一 个 做 网 站 的 架势 。 有 了 这 个 架势 ， 后 
面 的 事情 就 是 在 这 个 基础 上 添加 具体 内 容 。 当 然 ， 还 可 以 用 另外 一 个 更 
好 听 的 名 字 -一 设计 。 


依次 说 明 上 面 的 架势 中 每 个 目录 和 文件 的 作用 (当然 ， 这 个 作用 是 
我 规定 的 ， 如 果 读 者 愿意 ， 也 可 以 根据 自己 的 意愿 来 任意 设计 )。 


。 handlers: 我 准备 在 这 个 文件 夹 中 放 后 端 python 程 序 ， 主 要 人 处理 来 自 
前 端的 请 求 ， 并 且 操 作 数 据 库 。 

。 methods: 这 里 准备 放 一 些 函 数 或 者 类 ， 比 如 用 得 最 多 的 读 写 数据 
库 的 函数 ， 这 些 函 数 被 handlers 里 面 的 程序 使 用 。 

。 statics: 这 里 准备 放 一 些 静 态 文 件 ， 比 如 图 片 、css 和 JavaScript 文 件 

。 templates: 这 里 放 模 板 文件 ， 都 以 htm] 为 扩展 名 ， 它 们 将 直接 面 对 
用 户 。 


另外 ， 还 有 三 个 Python 文件 ， 依 次 写 下 如 下 内 容 。 这 些 内 容 的 功 
己 经 讲 过 ， 只 是 这 里 进行 分 门 别 类 。 

















ZN 
CC 


1.url.py 文 件 


#!/UsSr/bin/env python 
# coding=utf-8 


the url Structure of website 
nn 


import sys 
reload(sys) 
sys.setdefaultencoding("utf-8") 


from handlers.index import IndexHandler 


url = [ 
(r'/', IndexHandler), 
] 





url.py 文 件 主要 设置 网 站 的 目录 结构 。from handlers.index import 











IndexHandler， 虽 然 在 handlers 文 件 夹 还 没有 什么 东西 ， 为 了 演示 如 何 建 
立 网 站 的 目录 结构 ， 假 设 在 handlers 文 件 夹 里 面 已 经 有 了 一 个 文件 
index.py， 它 里 面 还 有 一 个 类 IndexHandler。 在 url.py 文 件 中 ， 将 其 引用 


变量 URL 指 向 一 个 列表 ， 在 列表 中 列 出 所 有 目录 和 对 应 的 处 理 类 。 


比如 (rW，IndexHandler) ， 就 是 约定 网 站 根 目 录 的 处 理 类 是 
IndexHandler， 即 来 自 这 个 目录 的 get0 或 者 postO 请 求 ， 均 有 
IndexHandler 类 中 相应 的 方法 来 处 理 。 


如 果 还 有 别 的 目录 ， 如 法 炮制 。 


2.application.py 文 件 


#!/UsSr/bin/env python 
# coding=utf-8 


from url import Url 


import tornado.web 
import os 


settings = dict( 
template_ path = os.path.join(os.path.dirname(_ file ), "templates"), 
static_path = os.path.join(os.path.dirname(_ file ), "statics") 


) 


application = tornado.web.Application( 
handlers = url, 
**settings 


) 


从 内 容 中 可 以 看 出 ， 这 个 文件 完成 了 对 网 站 系统 的 基本 配置 ， 





建 并 


网 站 的 请 求 处 理 集 合 。 
from url import url 是 将 url.py 中 设 定 的 目录 引用 过 来 。 


setting 引 用 了 一 个 字典 对 象 ， 里 面 约定 了 模板 和 静态 文件 的 路 径 ， 
即 声 明 已 经 建立 的 文件 夹 “templates” 和 “statics” 分 别 为 模板 目录 和 静态 文 
件 目录 。 


接 下 来 application 就 是 一 个 请 求 处 理 集合 对 象 。 请 注意 
tornado.web.Application() 的 参数 设置 : 


tornado.web.Application(handlers=None, default_ host='', transforms=None, **settings 


关于 settings 的 设置 ， 不 仅仅 是 文件 中 的 两 个 参数 ， 还 可 以 有 其 他 ， 
比如 ， 如 果 填 上 debug=True 束 表示 处 于 调试 模式 。 调 试 模式 的 好 处 是 开 
发 时 调试 方便 ， 但是， 在 正式 部 萌 的 时 候 ， 最 好 不 要 用 调试 模式 。 其 他 
更 多 的 settings 可 以 参看 官方 文档 : tornado.web-RequestHandler and 
Application classes (http://tornado.readthedocs.org/en/latest/web.html) 。 


3.server.py 文 件 


这 个 文件 的 作用 是 将 tornado 服 务 器 运行 起 来 ， 并 且 吉 括 前 面 两 个 文 
件 中 的 对 象 属性 设置 。 





#!/Uusr/bin/env python 
# coding=utf-8 


import tornado.ioloop 
import tornado.options 
import tornado.httpserver 
from application import application 
from tornado.options import define, options 
define("port", default = 8000, help = "run on the given port", type = int) 
def main(): 
tornado.options.parse_ command_line() 
http_server = tornado.httpserver.HTTPServer(application) 


http_server.listen(options.port) 


print "Development server is running at http://127.0.0.1:%s" % options.port 
print "Quit the server with Control-C" 


tornado.ioloop.IOLoop.instance().start() 


if name == "main " 
main() 





AN 


如 此 这 般 ， 就 完成 了 网 站 架势 的 搭建 ， 下 面 要 做 的 是 癌 里 面 添 加 内 


咏 


8.3.3 ”连接 数据 库 


网 站 不 一 定 非 要 有 数据 库 ， 但 是 如 果 做 一 个 功能 强悍 的 网 站 ， 数 据 
库 就 是 必需 的 了 。 


接 下 来 的 网 站 ， 和 暂且 采用 MySQL 数 据 库 。 


在 前 面 已 经 搭建 的 目录 结构 中 ， 找 到 methods， 并 建立 一 个 文件 
db.py， 然 后 分 别 建立 起 连接 对 象 和 游标 对 象 。 代 码 如 下 : 
#!/UsSr/bin/env python 
# coding=utf-8 
import MySQLdb 


conn = MySQLdb .connect(host="localhost", user="root", passwd="123123", db="qiwsirte 
cur = conn.cursor() 


8.3.4 登录 界面 


很 多 网 站 上 都 看 到 用 户 登 录 功 能 ， 这 里 做 一 个 简单 的 登录 ， 其 功能 
描述 为 : 

当 用 户 输入 网 址 ， 呈 现在 眼前 的 是 一 个 登录 界面 。 在 用 户 名 和 密码 
两 个 输入 框 中 分 别 输入 正确 的 用 户 名 和 密码 之 后 ， 单 击 确定 按钮 ， 登 ; 
网 站 ， 显 示 对 该 用 户 的 欢迎 信息 。 


用 图 示 来 说 明 ， 如 图 8-4 所 示 。 





用 尸 登录 界面 
用 户 和 名 :{f | 
密码:{f | 


一 一 一 一 6 一 一 一 一 


尚未 注册 的 用 户 ， 请 注册 





图 8-4 用 户 登 录 界 面 


用 户 单 击 “登录 ”按钮 ， 经 过 验证 是 合法 用 户 之 后 ， 就 呈现 如 图 8-5 
所 示 的 界面 。 








欢迎 XXX 


你 已 经 成 功 登录 本 站 


人 生 百 短 


请 学 python 











图 8-5 ”呈现 界面 


先 用 HIML 写 好 第 一 个 界面 。 进 入 到 templates 文 件 ， 建 立 名 为 
index.html 的 文件 : 


<!IDOCTYPE html> 
<head> 
<meta charset="UTF-8"> 
<meta name="viewport" content="width=device-width, initial-scale=1" /> 
<title>Learning Python</title> 
</head> 
<body> 
<h2>Login</h2> 
<form method="POST"> 
<p><span>UserName:</span><input type="text" id="username"/></p> 
<p><span>Password:</span><input type="password" id="password" /></p> 
<p><input type="BUTTON" value="LOGIN" id="]ogin" /></p> 
</form> 


</body> 


这 是 一 个 很 简单 的 前 端 界 面 。 要 特别 关注 <meta 
name="viewport"content="width=device-width，initial-scale=1"/>， 其 目的 
在 于 将 网 页 的 默认 宽度 〈viewport) 设置 为 设备 的 屏幕 宽度 

(width=device-width) ， 并 且 原 始 缩放 比例 为 1.0 〈initial-scale=1) ， 即 
网 页 初始 大 小 占 屏幕 面积 的 1009%。 这 样 做 的 目的 是 让 其 在 电脑 、 手 机 
等 不 同 大 小 的 屏幕 上 ， 都 能 很 好 地 显示 。 


这 种 样式 的 网 页 是 “ 自 适 应 页 面 ”。 当 然 ， 自 适应 页 面 绝 非 是 仅仅 有 
这 样 一 行 代码 就 完全 解决 的 。 要 设计 自 适 应 页 面 ， 就 是 要 进行 “响应 式 
设计 ”， 还 需要 对 CSS、JS 旋 至 于 其 他 元 素 如 表格 、 图 片 等 进行 设计 ， 或 
者 使 用 一 些 响应 式 设 计 的 框架 。 


一 提 到 能 够 在 手机 上 显示 ， 该 者 是 否 想到 了 HIML5 呢 ， 这 个 被 一 
些 人 热 摊 、 被 妨 一 些 人 成 视 的 家 伙 ， 考 庸 四 疑 ， 现 在 已 经 得 到 了 越 来 越 
广泛 的 应 用 。 


HTML5 是 HTML 最 新 的 修订 版 本 ，2014 年 10 月 由 万 维 网 联盟 
CW3C) 完成 标准 制定 。 目 标 是 取代 1999 年 所 制定 的 HTML 4.01 和 
XHTML 1.0 标 准 ， 以 期 能 在 互联 网 应 用 迅速 发 展 的 时 候 ， 使 网 络 标准 达 
到 符合 当代 的 网 络 需 求 。 广 义 论 及 HTML5 时 ， 实 际 指 的 是 包括 HTML、 
CSS 和 JavaScript 在 内 的 一 套 技术 组 合 。 


响应 式 网 页 设计 (英语 : Responsive Web Design， 通 常 缩写 为 
RWD) ， 又 被 称 为 自 适 应 网 页 设计 、 回 应 式 网 页 设计 。 是 一 种 网 页 设 
计 的 技术 做 法 ， 该 设计 可 使 网 站 在 多 种 浏览 设备 (从 加 面 电脑 显示 器 到 
移动 电话 或 其 他 移动 产品 设备 ) 上 阅读 和 导航 ， 同 时 减少 缩放 、 平 移 和 
滚动 。 

pe 可 以 直接 用 浏览 器 打开 网 页 ， 因 为 它 是 .html 格 式 的 
2 人 


虽然 完成 了 视觉 上 的 设计 ， 但 是 ， 如 果 单 击 login 按 钮 ， 没 有 任何 反 
应 。 因 为 它 还 仅仅 是 一 个 孤立 的 页 面 ， 这 时 候 需 要 一 个 前 端 交 互利 器 
JavaScript。 


对 于 JavaScript， 不 少 人 对 它 有 误解 ， 总 认为 它 是 从 Java 演 化 出 来 




















的 。 它 们 两 个 有 相像 的 地 方 ， 但 其 关系 就 如 同 “ 雷 峰 塔 ?和 * 雷 锋 ? 一 样 。 
详细 读 一 读 来 自 维基 百科 的 诠释 。 


JavaScript， 一 种 直译 式 脚 本 语言 ， 是 一 种 动态 类 型 、 弱 类 型 、 基 于 
原型 的 语言 ， 内 置 支 持 类 。 它 的 解释 器 被 称 为 JavaScript 引 擎 ， 为 浏览 器 
的 一 部 分 ， 广 泛 用 于 客户 端的 脚本 语言 ， 最 早 是 在 HTML 网 页 上 使 用 ， 
人 然而 现在 也 可 以 被 用 于 网 络 服务 器 ， 
HNode.js。 


在 1995 年 时 ， 由 网 景 公 司 的 布 兰 登 : 艾 元 ， 在 网 景 导 航 者 浏览 器 上 
首次 设计 实现 而 成 。 因 为 网 景 公 司 与 异 阳 公 司 合作 ， 网 景 公司 管理 层 希 
望 它 外 观看 起 来 像 Java， 因 此 取 名 为 JavaScript。 但 实际 上 它 的 语义 与 
Self 及 Scheme 较 为 接近 。 


为 了 获取 技术 优势 ， 微 软 推出 了 JScript， 与 JavaScript 同 样 可 在 浏览 
器 上 运行 。 为 了 统一 规格 ，1997 年 ， 在 ECMA 《〈 欧 洲 计算 机 制造 商 协 
会 ) 的 协调 下 ， 由 网 景 、 异 阳 、 微 软 和 Borland 公 司 组 成 的 工作 组 确定 
统一 标准 : ECMA-262。 因 为 JavaScript 兼 容 于 ECMA 标 准 ， 因 此 也 称 为 
上 ECMA9Script。 


但 是 ， 我 更 喜欢 用 jQuery， 因 为 它 的 确 让 我 省 了 不 少 事 。 


jQuery 是 一 套 跨 浏 览 器 的 JavaScript 库 ， 可 以 简化 HTML 与 JavaScript 
之 间 的 操作 。 由 约翰 : 雷 西 格 (John Resig) 于 2006 年 1 月 在 BarCamp 
NYC 上 发 布 第 一 个 版 本 。 目 前 是 由 Dave Methvin 领 导 的 开发 团队 进行 开 
发 。 在 全 球 前 10，000 个 访问 最 高 的 网 站 中 ， 有 65% 使 用 了 jQuery， 是 目 
前 最 受 欢迎 的 JavaScript 库 。 


在 index.html 文 件 中 引入 jQuery 的 方法 有 多 种 。 
原则 上 ， 可 以 在 HTML 文 件 的 任何 地 方 引入 jQuery 库 ， 但 是 通常 放 
置 的 地 方 在 htm] 文 件 的 开头 <head>...</head> 中 ， 或 者 在 文件 的 末尾 


</body> 以 内。 知 放 在 开头 ， 如 宁 所 用 的 库 比 较 大 、 比 较 多 ， 在 载 入 页 
面 时 的 时 间 相 对 较 长 。 


第 一 种 引入 方法 是 国际 化 的 一 种 : 
































<script src="http://ajax.googleapis.com/ajax/libs/jquery/1.11.2/jquery.min.js"></sc 


这 是 直接 从 jQuery CDN (Content Delivery Network) 上 直接 引用 ， 
好 处 在 于 如 果 这 个 库 更 新 ， 你 不 用 做 任何 操作 ， 就 直接 使 用 最 新 的 了 。 


当然 ，jQuery CDN 不 止 一 个 ， 比 如 官方 网 站 的 : <script 
src="//code.jquery.com/jquery-1.11.3.min.js"></script>。 


第 二 种 引入 方法 是 将 jQuery 下 载 下 来 ， 放 在 指定 地 方 《比如 ， 与 自 
己 的 网 站 在 同一 个 存储 器 中 ， 或 者 目 己 可 以 访问 的 另外 服务 器 ) 。 到 官 
方 网 站 (https://jqueryui.com/〉 下 载 最 新 的 库 ， 然 后 将 它 放 在 已 经 建立 
的 statics 目 录 内 ， 为 了 更 清楚 地 区 分 ， 可 以 在 里 面 建 立 一 个 子 目 录 js， 
jQuery 库 放 在 js 子 目录 里 面 。 下 载 的 时 候 ， 建 议 下 载 以 min,js 结 尾 的 文 
件 ， 因 为 这 个 是 经 过 压缩 之 后 的 ， 体 积 小 。 


我 在 statics/js 目 录 中 放置 了 下 载 的 库 ， 并 且 为 了 简短 ， 更 名 为 


jquery.min.js。 


可 以 用 下 面 的 方法 引入 : 








<script src="statics/js/jquery.min.js"></script> 


如 琳 这 样 写 也 是 可 以 的 ， 但 是 考虑 到 Tornado 的 特点 ， 用 下 面 的 方 
法 引入 更 具有 灵活 性 : 





<script src="{{static_url("js/jquery.min.js")}}"></script> 


不 仅 要 引入 jQuery， 还 需要 引入 上 自己 写 的 js 指令 ， 所 以 要 建立 一 个 
文件 ， 我 命名 为 scriptjs， 也 同时 引用 过 来 ， 虽 然 目 前 这 个 文件 还 是 空 
的 。 


<script src="{{static_ url("js/script.js")}}"></script> 


这 里 用 的 static_url0O 是 Tornado 模 板 提供 的 一 个 函数 ， 用 这 个 函数 ， 
能 够 制定 静态 文件 。 之 所 以 用 它 ， 而 不 是 用 上 面 的 那 种 直接 调用 的 方 
法 ， 主 要 原因 是 如 果 某 一 天 ， 将 静态 文件 目录 statics 修 改 了 ， 即 不 指定 
statics 为 静态 文件 目录 了 ， 定 义 别 的 目录 为 静态 文件 目录 。 只 需要 在 定 
义 静 态 文件 目录 那里 修改 ， 而 其 他 地 方 的 代码 不 需要 修改 。 


先 写 一 个 测试 性 质 的 东西 。 





用 编辑 器 打开 statics/js/script.js 文 件 ， 如 果 没 有 束 新 建 。 输 入 的 代码 
I 下 : 


$(document).ready(function(){ 
alert("good"); 
$("#1l0gin").click(function(){ 
var user = $("#username").val(); 
Var pwd = $("#password").val(); 
alert("username: "+user); 


由 于 本 书 不 是 专门 讲授 JavaScript 或 者 jQuery， 所 以 ， 在 js 代码 部 
分 ， 只 能 一 带 而 过 ， 不 详细 解释 。 


上 面 的 代码 主要 实现 获取 表单 中 的 id 值 分 别 为 username 和 password 
输入 的 值 ，alert 函 数 的 功能 是 把 值 以 弹出 菜单 的 方式 显示 出 来 。 


古人 否 还 记得 url.py 文 件 ? 做 这 样 的 设置 : 


from handlers.index import IndexHandler 


url = [ 
(r'/', IndexHandler), 
] 


现在 把 假设 有 了 的 那个 文件 index.py 建 立 起 来 ， 即 在 handlers 里 面 建 
index.py 文 件 ， 并 写 入 如 下 代码 : 
#!/UsSr/bin/env python 
# coding=utf-8 
import tornado ,web 
class IndexHandler(tornado.web.RequestHandler ) : 


def get(self): 
self.render("index.html") 





当 访 问 根 目录 的 时 候 ， 束 将 相应 的 请 求 交 给 了 handlers 目 录 中 
index.py 文 件 的 IndexHandler 类 的 get(0) 方 法 来 处 理 ， 它 的 处 理 结 果 呈 现 
index.html 模 板 内 容 。 


render() 阔 数 的 功能 在 于 回 请 求 者 反馈 网 页 模板 ， 并 且 可 以 问 模 板 
中 传递 数值 。 





将 上 面 的 文件 保存 之 后 ， 回 到 handlers 目 录 中 。 因 为 这 里 面 的 文件 
要 在 别处 被 当 作 模块 引用 ， 所 以 ， 需 要 在 这 里 建立 一 个 空 文件 ， 命 名 为 
_ init_.py。 这 个 文件 非常 重要 。 只 要 在 目录 中 加 入 了 这 个 文件 ， 该 目 
录 中 的 其 他 .py 文件 束 可 以 作为 模块 被 Python 引 入 了。 


至 此 ， 一 个 带 有 表单 的 网 站 就 建立 起 来 了 。 读 者 可 以 回 到 上 一 级 目 
录 中 ， 找 到 server.py 文 件 ， 并 运行 它 : 





$ _ python server .py 
Development server is running at http://127.0.0.1:8000 
QUit the server with Control-C 


如 果 读 者 在 前 面 的 学 习 中 ， 跟 我 的 操作 完全 一 致 ， 就 会 在 shell 中 看 
到 上 和 面 的 结果 。 


打开 浏览 器 ， 输 入 http://localhost:8000 或 者 http://127.0.0.1:8000， 看 
到 的 应 该 如 图 8-6 所 示 。 








图 8-6 ”弹出 对 话 框 
这 就 是 script.js 中 的 “alert《"good") ;开始 起 作用 了 ， 第 一 句 是 要 弹 





出 一 个 对 话 框 。 单 击 “ 确 定 ”按钮 之 后 如 图 8-7 所 示 。 





图 8-7” 单 击 “确定 ”按钮 后 的 对 话 框 
在 这 个 页 面 输入 用 户 名 和 密码 ， 然 后 单 击 Login 按 钮 ， 如 图 8-8 所 








图 8-8 ”网 站 纵 形 
一 个 网 站 有 了 雏形。 不 过 ， 提 交 表 单 的 反应 ， 还 仅仅 停留 在 客户 





端 ， 且 没有 同 后 端 传递 客户 端的 数据 信息 ， 接 下 来 就 解决 这 个 问题 。 


8.3.5 ”数据 传输 





在 建立 了 前 端 表 单 之 后 ， 就 要 实现 前 端 和 后 端 之 间 的 数据 传递 。 在 
工程 中 ， 第 用 到 一 个 被 称 之 为 Ajax0 的 方法 。 


关于 Ajax 的 故事 ， 需 要 浓墨重彩 ， 因 为 它 足 够 精彩 。 


Ajax 是 “Asynchronous Javascript and XML”( 异 步 JavaScript 和 和 

XML) 的 缩写 ， 在 它 的 发 展 历程 中 ， 汇 集 了 众 家 页 献 。 比 如 微软 的 下 团 
队 曾 经 将 XHR (XML HttpRequest) 用 于 Web 浏 览 器 和 和 Web 服务 器 则 传 

输 数据 ， 并 且 被 W3C 标 准 采用 。 当 然 ， 也 有 其 他 公司 为 Ajax 技术 做 出 了 
贡献 ， 虽 然 他 们 都 被 遗 访 了， 比如 Oddpost， 后 来 被 Yahoo! 收购 并 成 为 
Yahoo! Mail 的 基础 。 但 是 ， 真 正 让 Ajax 大 放 异 彩 的 Google 是 不 能 被 忽 

视 的 ， 正 是 Google 在 Gmail、Suggest 和 Maps 上 大 规模 使 用 了 Ajax， 才 使 
得 人 们 看 到 了 它 的 魅力 ， 程 序 员 由 此 而 兴奋 。 


技术 总 是 在 不 断 进 化 的 ， 进 化 的 方 回 束 是 用 着 越 来 越 方 便 。 
回 到 jQuery， 里 面 束 有 Ajax0 方 法 ， 能 够 让 程序 员 方便 地 调用 。 
Ajax() 方 法 通过 HTTP 请 求 加 载 远 程 数 据 。 





该 方法 是 jQuery 底层 AJAX 实 现 。 简 单 易 用 的 高 层 实现 如 $.get、 
$.post 等 。$.ajax() 返 回 其 创建 的 XMLHttpRequest 对 象 。 大 多 数 情况 下 你 
无 须 直 接 操 作 该 函数 ， 除 非 你 需要 操作 不 常用 的 选项 ， 以 获得 更 多 的 灵 
活性 。 


最 简单 的 情况 下 ，$.ajaxO 可 以 不 带 任何 参数 直接 使 用 。 


在 上 文 介绍 Ajax 的 时 候 ， 用 到 了 一 个 重要 的 术语 一 一 弄 步 ”， 与 之 
相对 应 的 叫 作 “同步 *"， 对 此 引用 来 自 阮 一 峰 的 网 络 日 志 中 的 通俗 描述 : 


“同步 模式 ?就 是 上 一 段 的 模式 ， 后 一 个 任务 等 待 前 一 个 任务 结束 ， 
然后 再 执行 ， 程 序 的 执行 顺序 与 任务 的 排列 顺序 是 一 致 的 、 同 步 
的 ;“ 寞 步 模式 ” 则 完全 不 同 ， 每 一 个 任务 有 一 个 或 多 个 回调 函数 
Ccallback) ， 前 一 个 任务 结束 后 ， 不 是 执行 后 一 个 任务 ， 而 是 执行 回 
调 函 数 ， 后 一 个 任务 则 是 不 等 前 一 个 任务 结束 就 执行 ， 所 以 程序 的 执行 














顺序 与 任务 的 排列 顺序 是 不 一 致 的 、 异 步 的 。 


“异步 模式 ”非常 重要 。 在 浏览 器 端 ， 耗 时 很 长 的 操作 都 应 该 异步 执 
行 ， 避 免 浏 览 器 失去 啊 应 ， 最 好 的 例子 就 是 Ajax 操作 。 在 服务 器 
端 , “异步 模式 ?甚至 是 唯一 的 模式 ， 因 为 执行 环境 是 单线 程 的 ， 如 果 人 多 
人 服务 器 性 能 会 急剧 下 降 ， 很 快 就 会 失去 啊 
Ny 


看 来 ，Ajax0 是 前 后 端 进行 数据 传输 的 重要 角色 。 


承接 前 面 对 人 简单 网 站 的 研发 ， 接 下 来 是 用 Ajax0) 方 法 实现 前 后 并 的 
数据 传输 ， 只 需要 修改 script.js 文 件 内 容 即 可 : 








$(document) .ready(function(){ 
$("#1l0gin").click(function(){ 
Var user = $("#username").val(); 
var pwd = $("#password").val(); 
var pd = {"username":user, "password":pwd}; 
$.ajax({ 
type:"post", 
url:"/", 
data:pd, 
cache:false, 
success:function(data)t{ 
alert(data); 


和 
error:function(){ 
alert("error!"); 


_ 


}); 
}); 


在 这 段 代 码 中 , “var pd={"username":user，"password":pwd};” 是 将 
得 到 的 user 和 pwd 值 ， 放 到 一 个 json 对 象 中 。 接 下 来 就 是 利用 Ajax0 方 法 
将 这 个 json 对 象 传 给 后 端 。 


jQuery 中 的 Ajax(0 方 法 使 用 比较 简单 ， 正 如 上 面 的 代码 所 示 ， 只 需 
要 $.ajaxO 即 可 ， 不 过 需要 对 里 面 的 参数 进行 说 明 。 








。 type: 古 post 还 是 get。 

。 url: post 或 者 get 的 地 址 。 

。 data: 传输 的 数据 ， 包 括 三 种 ，〈1) html 拼 接 的 字符 串 ; (2) json 
数据 ， 〈3) form 表 单 经 serialize0 序 列 化 的 。 本 例 中 传输 的 就 是 json 
数据 ， 这 也 是 经 常用 到 的 一 种 方式 。 





。 cache: 默认 为 True， 如 果 不 允 许 缓存 ， 设 置 为 False。 

。 success: 请 求 成 功 时 执行 回调 函数 。 本 例 中 ， 将 返回 的 data 用 alert 
方式 弹出 来 。 读 者 是 否 注意 到 ， 我 在 很 多 地 方 都 用 了 alert() 这 个 东 
西 ， 目的 在 于 调试 ， 走 一 步 看 一 步 ， 看 看 得 到 的 数据 是 否 是 自己 所 


女 o 
。 error: 请 求 失败 所 执行 的 函数 。 








8.3.6 ”数据 处 理 


前 端 通过 Ajax 技术 ， 将 数据 以 json 格 式 传 给 了 后 端 清 ， 并 且 指 明了 对 
象 目录 ""， 这 个 目录 在 url. py 文件 中 已 经 做 了 配置 ， 是 由 handlers 目 录 中 
index.py 文 件 的 IndexHandler 类 来 处 理 。 因 为 是 用 post 方 法 传 的 数据 ， 那 
么 在 这 个 类 中 就 要 有 post 方 法 来 接收 数据 。 所 以 ， 要 在 IndexHandler 类 中 
增加 post0， 增 加 之 后 的 完善 代码 是 : 





#!/UsSr/bin/env python 
# coding=utf-8 


Import tornado ,web 


class IndexHandler(tornado.web.RequestHandler ) : 
def get(self): 
SeJf,render("index.htm]1") 


def post(self): 
username = self.get_argument("username") 
password = self.get_argument("password") 
self .write(username) 


在 post0) 方 法 中 ， 使 用 get_argumentO 函 数 来 接收 前 端 传 过 来 的 数 
据 ， 这 个 函数 的 完整 格式 是 get_argument (name，default=[]， 
strip=True)， 它 能 够 获取 name 的 值 。 在 上 面 的 代码 中 ，name 束 是 从 前 
端 传 到 后 的 于 个 json 对 象 的 键 的 名 字 ， 是 哪个 键 就 获取 哪个 键 的 值 。 
如 果 获 取 不 到 name 的 值 ， 就 返回 default 的 值 ， 但 是 这 个 值 默认 是 没有 
的 ， 如 果真 的 没有 就 会 抛 出 HTTP 400。 特 别 注意 ， 在 get 的 时 候 ， 通 过 
get_ argument0) 沙 数 获 天 得 url 的 参数 ， 如 果 是 多 个 参数 ， 就 获取 最 后 一 个 
的 值 。 要 想 获 取 多 个 值 ， 可 以 使 用 get_arguments (name， 
strip=True) 。 


上 例 中 分 别 用 get_argument() 方 法 得 到 了 username 和 password， 并 且 


它们 都 是 unicode 编 码 的 数据 。 


tornado.web.RequestHandler 的 方法 write0， 即 上 例 中 的 
self.write (username) ， 是 后 端 向 前 端 返回 数据 。 这 里 返回 的 实际 上 是 
一 个 字符 串 ， 也 可 返回 json 字 符 串 。 


如 果 读 者 要 查看 修改 代码 之 后 的 网 站 效果 ， 最 有 效 的 方式 是 先 停止 
网 站 (ctrltc) ， 再 重新 执行 python server.py 运 行 网 站 ， 然 后 刷新 浏览 
即 可 。 这 是 一 种 较为 笨拙 的 方法 。 一 种 灵巧 的 方法 是 开局 调试 模式 。 在 
设置 setting 的 时 候 ， 写 上 debug=True 就 表示 是 调试 模式 了 。 但 是 ， 调 试 
模式 也 不 是 十 全 十 美 ， 如 果 修 改 模板 ， 就 不 会 加 载 ， 还 需要 重启 服务 。 


看 看 上 面 的 代码 效果 ， 如 图 8-9 所 示 。 








图 8-9 ”代码 效果 


前 端 输 入 了 用 户 名 和 密码 之 后 ， 单 击 login 按 钮 ， 提 交 给 后 端 ， 后 端 
再 同 前 问 返 回 数 据 之 后 的 效果 。 这 就 是 我 们 想 要 的 结果 。 

按照 流程 ， 用 户 在 前 端 输 入 了 用 户 名 和 密码 ， 并 通过 Ajax 提交 到 了 
后 端 ， 后 端 借助 于 get_argument() 方 法 得 到 了 所 提交 的 数据 《用户 名 和 密 
。 下 面 要 做 的 事情 就 是 验证 这 个 用 户 名 和 密码 是 否 合法 ， 其 体现 
三 








。 数据 库 中 是 否 有 这 个 用 户 。 
。 密码 和 用 户 先 前 设 定 的 密码 (已 经 保存 在 数据 库 中 〉 是 否 匹 配 。 


这 个 验证 工作 完成 之 后 ， 才 能 允许 用 户 登 录 ， 登 录 之 后 才能 继续 做 
某 些 事情 。 


自 先 ， 在 methods 目 录 中 (已 经 有 了 一 个 db.py) 创建 一 个 文件 ， 我 
将 其 命名 为 readdb.py， 专 门 用 来 存储 读数 据 用 的 函数 (这 种 划分 完全 是 
为 了 明确 和 演示 一 些 应 用 方法 ， 读 者 也 可 以 都 写 到 db.py 中 ) 。 这 个 文 
件 的 代码 如 下 : 





#!/UsSr/bin/env python 
# coding=utf-8 


from db import * 


def select_table(table, column, condition, value ): 
Sql = "select " + column + " from " + table + " where " + condition + "='" + Vva 
cur .execute(sql) 
lines = cur.fetchall() 
return lines 


上 面 这 上 段 代 码 ， 建 议 读者 写 上 注释 ， 以 检验 自己 是 否 能 够 将 以 往 的 
知识 融会 贯通 地 应 用 。 


有 了 这 段 代 码 之 后 ， 束 进一步 改写 mpdex.py 中 的 post0 方 法 。 为 了 明 
了 ， 将 index.py 的 全 部 代码 呈现 如 下 : 
#!/UsSr/bin/env python 
# coding=utf-8 


Import tornado ,web 
import methods ,readdb as mrd 


class IndexHandJler(tornado,web .RequestHandJer ) : 
def get(self): 
self.render("index.html") 


de 


下 


post(self): 
username = self.get_argument("username") 
password = self.get_argument("password") 
user_infos = mrd.select_ table(table="users",column="*",condition="username" 
if user_infos: 
db_pwd = user_infos[0][2] 
if db_pwd == password: 
self.write("welcome you: " + Username ) 
else: 
self.write("your password was not right.") 
else: 
self.write("There is no thi user.") 





特别 注意 ， 在 methods 目 录 中 ， 只 有 不 缺少 _init .py 文件 ， 才 能 在 
index.py 中 实现 import methods.readdb as mrd。 


代码 修改 到 这 里 ， 看 到 的 结果 如 图 8-10 所 示 。 





图 8-10 ”修改 代码 的 结果 


如 图 8-11 所 示 是 正确 输入 用 户 名 (所 谓 正 确 ， 就 是 输入 的 用 户 名 和 
密码 合法 ， 即 在 数据 库 中 有 该 用 户 名 ， 且 密码 匹配 ) ， 并 提交 数据 后 ， 
反馈 给 前 端的 欢迎 信息 。 





€ | localhost:a000 | G ||Q search 人 妆 自 辕 寻 会 全 入 福 - 名 三 


your password was not right. 





图 8-11 ”欢迎 信息 
用 户 的 输入 是 最 不 可 靠 的 ， 或 许 会 出 现 多 种 情况 
如 图 8-12 所 示 是 输入 的 密码 错误 了 ， 前 端 反 馈 给 用 户 提 示 的 信息 。 


所 mlocalhost:Bo00 | Ge ||Q search | 会 | 自 量 会 上 四则 衬 *" 晤 话 v” 咏 三 








图 8-12 


这 是 随意 输入 的 结果 ， 数 据 库 中 无 此 用 户 。 


上 述 演示 中 ， 数 据 库 中 的 用 户 密码 并 没有 加 密 ， 这 不 是 真实 的 开发 
行为 ， 在 真实 的 开发 中 ， 一 定 要 加 黎 传 输 。 


8.3.7 模板 


网 站 做 到 现在 ， 突 然 发 现 ， 前 端 页 面 写 得 太 难看 了 。 众 话说 “外 行 
看 热 间 ， 内 行 看 门道 ”。 程 序 员 写 的 网 站 ， 在 更 多 时 候 是 给 外行? 看 
的 ， 他 们 可 没有 耐心 来 看 代码 ， 他 们 看 的 就 是 界面 ， 因 此 把 界面 做 得 漂 
亮 一 点 点 至 关 重 要 。 


其 实 ， 也 不 仅仅 是 漂亮 的 原因 ， 而 且 前 问 页 面 还 要 显示 从 后 端 读 取 
出 来 的 数据 。 


恰好， Tornado 提 供 比较 好 用 的 前 端 模板 〈tornado.template) ， 通 过 
这 个 模板 ， 能 够 让 前 端 编写 更 方便 。 














e Iender() 


render0 〇 万 法 和 E 够 告诉 Tornado 读 入 哪个 模板 ， 插 入 其 中 的 模板 代 
码 ， 并 返回 结果 给 浏览 器 。 比 如 在 IndexHandler 类 中 get0 方 法 里 面 的 
self.render ("index.html") ， 束 0 目 中 找到 名 为 
index.html 的 文件 ， 读 出 它 的 内 容 ， 返 回 给 浏览 器 。 这 样 用 户 束 能 看 到 
index.html 所 规定 的 页 面 了 。 前 面 所 写 的 index.htmi 仅 仪 是 html 标 记 ， 没 
Be :出 所 请 “模板 ”的 作用 。 为 此 ， 将 index.html 和 index.py 文 件 做 如 下 
改造 





#!/Uusr/bin/env python 
# coding=utf-8 


import tornado.web 
import methods ,readdb as mrd 


class IndexHandler(tornado.web.RequestHandler ) : 
def get(self): 
usernames = mrd.select_ columns(table="users",column="username") 
one_user = usernames[0][90] 
self.render("index.html", user=one_user) 


index.py 文 件 中 ， 只 修改 了 0 从 数据 库 中 读 取 用 户 名 ， 并 
且 提 出 用 户 (one_user) ， 然 后 通过 self.render ("index.html"， 


user=one_user) 将 这 个 用 户 名 放 到 index.html 中 ， 其 中 user=one_user 的 作 
用 束 是 传递 对 象 到 模板 。 


要 提醒 读者 注意 的 是 ， 在 上 面 的 代码 中 ， 我 使 用 了 
mrd.select_columns (table="users"，column="username") ， 也 就 是 说 必 
须要 在 methods 目 录 中 的 readdb.py 文 件 中 有 一 个 名 为 select_columns 的 疗 
数 。 为 了 使 读者 能 够 理解 ， 巾 出 已 经 修改 的 readdb.py 文 件 代码 ， 比 上 一 
节 多 了 函数 select_columns: 


#!/UsSr/bin/env python 
# coding=utf-8 


from db import * 


def select_ table(table, column, condition, value ): 
sql = "Select "+ column + " from " + table + " where " + condition + "='" + Vva 
cur .execute(sql) 
lines = cur.fetchall() 
return lines 


def select_columns(table, column ): 
Sql = "Select " + column + " from " + table 
cur .execute(sql) 
lines = cur.fetchall() 
return lines 


下 面 是 index.html 修 改 后 的 代码 : 


<!IDOCTYPE html> 

<head> 
<meta charset="UTF-8"> 
<meta name="viewport" content="width=device-width, initial-scale=1" /> 
<title>Learning Python</title> 





























</head> 
<body> 
<h2> 登 录 页 面 
</h2> 
<p> 用 用 户 名 为 : 
{{uSser}} 登 录 
</p> 


<form method="POST"> 
<p><span>UserName:</span><input type="text" id="username"/></p> 
<p><span>Password:</span><input type="password" id="password" /></p> 
<p><input type="BUTTON" value=" 登 录 


" id="login" /></p> 


</form> 

<script src="{{static url("js/jquery.min.js")}}"></script> 

<script src="{{static url("js/script.js")}}"></script> 
</body> 


“<p> 用 户 名 为 : {{user}} 登 录 </p>”， 在 这 里 用 了 “{{}}* 方 式 接受 对 
应 的 变量 引用 的 对 象 。 即 在 首页 打开 之 后 ， 用 户 应 当 看 到 有 一 行 提示 ， 
如 图 8-13 所 示 。 





Learning Python 


localhost 


登录 页 面 


用 用 户 名 为 : qiwsir 登 录 


UserName: 


Password: 





图 8-13 ”首页 提示 


图 中 第 尖 所 指 束 是 从 数据 库 中 读 取出 来 的 用 户 名 ， 借 助 于 模板 中 的 
双 大 括 写 “{{}})” 显 示 出 来 。 


“{ 人 ”本质 上 是 占 位 符 ， 当 这 个 html 被 执行 的 时 候 ， 这 个 位 置 会 被 
一 个 具体 的 对 象 ( 例 如 上 面 就 是 字符 串 qiwsir〉 所 丛 代 。 具 体 是 哪个 上 其 
体 对 象 蔡 代 这 个 占 位 符 ， 完 全 由 render() 方 法 中 的 关键 词 来 指定 ， 也 就 
是 render0 中 的 关键 词 与 模板 中 的 占 位 符 包 庄 着 的 关键 词 一 致 。 


用 这 种 方式 ， 修 改 一 下 用 户 正确 登录 之 后 的 效果 。 要 求 用 户 正 确 登 
录 之 后 ， 跳 转 到 为 外 一 个 页 面 ， 并 且 在 那个 页 面 中 显示 出 用 户 的 完整 信 


























先 修改 url.py 文 件 ， 在 其 中 增加 一 些 内 容 。 完 整 代码 如 下 : 


#!/UsSr/bin/env python 
# coding=utf-8 


the Url structure of website 


import sys 
reload(sys) 
sys.setdefaultencoding("utf-8") 


from handlers.index import IndexHandler 
from handlers.user import UserHandler 


url = [ 
(r'/', IndexHandler), 
(r'/user', UserHandler), 


然后 就 建立 handlersuser.py 文 件 ， 内 容 如 下 : 


#!/UsSr/bin/env python 
# Coding=utf-8 


import tornado ,web 
import methods .readdb as mrd 


class UserHandler(tornado .web ,RequestHandler ) : 
def get(self): 
username = self.get_argument("user") 
user_infos = mrd.select_ table(table="users",column="*",condition="username" 
self.render("user.html", users = user_infos) 


在 get() 中 使 用 self.get_argument ("user") ， 目 的 是 要 通过 ul 获取 参 
数 user 的 值 。 因 此 ， 当 用 户 登 录 后 ， 得 到 正确 的 返回 值 ， 那 么 js 应 该 用 
这 样 的 方式 载 入 新 的 页 面 。 


注意 ， 上 述 的 user.py 代 码 为 了 简单 仅 突 出 本 将 要 说 明 的 ， 没 有 对 
user_infos 的 结果 进行 判断 ， 但 在 实际 的 编程 中 ， 需 要 进行 判断 或 者 使 用 


try...except。 





$(document).ready(function(){ 
$("#10gin").click(function(){ 
Var user = $("#username").val(); 
var pwd = $("#password").val(); 
var pd = {"username":user, "password":pwd}; 
$.ajax({ 
type:"post", 


url:"/", 

data:pd, 

cache:false, 

Success:function(data){ 
window.location.href = "/user?user="+data; 

}, 

error:function(){ 
alert("error!"); 

}, 

}); 
}); 
}); 


接 下 来 是 user.html 模 板 。 注 意 ， 上 面 的 代码 中 ，user_infos 引 用 的 对 
象 不 是 一 个 字符 串 了 ， 即 传 入 模板 的 不 是 一 个 字符 串 ， 而 是 一 个 元 组 。 
对 此 ， 模 板 这 样 来 处 理 它 : 


<!IDOCTYPE html> 
<head> 
<meta charset="UTF-8"> 
<meta name="viewport" content="width=device-width, initial-scale=1" /> 
<title>Learning Python</title> 
</head> 
<body> 
<h2>Your informations are:</h2> 
<ul> 
{% for one in users %} 
<li>username:{{one[1]}}</1i> 
<l1i>password:{{one[2]}}</1i> 
<li>email:{{one[3]}}</1i> 
{% end %} 
</ul> 
</body> 


显示 的 效果 如 图 8-14 所 示 。 


Learning Python 


< localhost 


完 Your informations are: 


es USsername:qiwsir 
。 password:123123 
se。 email:qiwsir@gmail.com 





图 8-14 ”显示 的 效果 
在 上 面 的 模板 中 ， 其 实用 到 了 模板 语法 。 


在 模板 的 双 大 括号 中 ， 可 以 写 类 似 Python 的 语句 或 者 表达 式 。 比 
中 





>>> from tornado.template import Template 

>>> print Template("{{ 3+4 }}").generate() 

7 

>>> print Template("{{ 'python'[0:2] }}").generate() 


py 
>>> print Template("{{ '-'.join(str(i) for i in range(10)) }}").generate() 
0-1-2-3-4-5-6-7-8-9 


如 果 在 模板 中 的 某 个 地 方 写 上 {{3+4}}， 当 那个 模板 说 render0 读 入 
之 后 ， 在 页 面 上 该 占 位 符 的 地 方 就 显示 7。 这 说 明 Tomado 上 自动 将 双 大 括 
号 内 的 表达 式 进 行 计算 ， 并 将 其 结果 以 字符 串 的 形式 返回 到 浏览 右 输 
出 。 





除了 表达 式 之 外 ，Python 的 语句 也 可 以 在 表达 式 中 使 用 ， 包 括 站 、 
for、while 和 try。 只 不 过 要 有 一 个 语句 做 开始 和 结束 的 标记 ， 用 以 区 分 
哪里 是 语句 、 哪 里 是 HTML 标 记 符 。 


语句 的 形式 : {{% 语 句 %}} 
例如 : 


{{% if user=='qiwsir' %}} 
{{ user }} 
{{% end %}} 





上 面 的 举例 中 ， 第 一 行 虽然 是 if 语 句 ， 但 是 不 要 在 后 面 写 冒 号 了 。 
最 后 一 行 一 定 不 能 缺少 ， 表 示 语 句 块 结束 。 将 这 一 个 语句 块 放 到 模板 
中 ， 当 被 render 读 取 此 模板 的 时 候 ，Tornado 将 执行 结果 返回 给 浏览 器 显 
ee 实际 例子 中 可 以 看 上 图 的 输出 结果 和 对 应 的 
循环 语句 。 





8.3.8” 转 义 字 符 





虽然 读者 已 经 对 字符 转 义 问题 不 陌生 了 ， 但 是 在 网 站 开发 中 ， 它 还 
是 一 个 令 人 感到 及 烦 的 问题 。 转 义 字符 〈Escape Sequence) 也 称 为 字符 
实体 (Character Entity) ， 它 的 存在 是 因为 在 网 页 中 “<”、“>” 之 类 的 符 
号 不 能 直接 被 输出 ， 因 为 它们 已 经 被 用 作 了 HTML 标记 符 ， 如 果 在 网 页 
上 用 到 它们 ， 束 要 转 义 。 男 外 ， 还 有 一 些 字 符 在 ASCII 字 符 集中 没有 定 
义 《〈 如 版 权 符号 “S ”) ， 寿 这 样 的 符号 在 HIML 中 出 现 ， 也 需要 转 义 字 
符 《〈 如 “9 "对 应 的 转 义 字符 是 “人 copy;”) 。 


上 述 是 指 前 端 页 面 的 字符 转 义 ， 在 后 端 程序 中 ， 因 为 要 读 写 数据 
库 ， 也 会 过 到 字符 转 义 问题 。 


比如 一 个 简单 的 查询 语句 “select username，password from usertable 
where username='qiwsir”， 如 果 在 登录 框 中 没有 输入 “qiwsir”， 而 是 输入 
了 “a;drop database;”， 这 个 查询 语句 就 变 成 了 “select username，password 
from usertable where username=a;drop database;”， 如 果 后 端 程序 执行 了 这 
条 语句 会 怎么 样 呢 ? 后 果 很 严重 ， 因 为 会 drop database， 届 时 真 的 是 欲 
器 无 泪 了 了 人。 类 似 的 情况 还 很 多 ， 比 如 还 可 以 输入 “<input type="text"/>”， 
结果 出 现 了 一 个 输入 框 ， 如 果 是 “<form action="..."”， 就 会 造成 跨 站 攻 
击 。 这 方面 的 问题 还 很 多 ， 读 者 有 空 可 以 到 网 上 搜索 一 下 。 




















所 以 ， 后 端 也 要 转 义 。 转 义 是 不 是 很 昧 烦 呢 ? 


Tornado 为 你 着 想 了 ， 因 为 存在 以 上 转 义 问题 ， 而 且 会 有 粗心 的 程 
序 员 瑟 记 ， 于 是 在 Tornado 中 ， 模 板 默认 为 目 动 转 义 ， 这 是 多 么 好 的 设 
计 呀 。 于 是 所 有 表单 输入 ， 你 整 不 用 担心 会 遇 到 上 述 问 题 了 。 


为 了 能 够 体会 自动 转 义 ， 不 妨 在 登录 框 中 输入 上 面 那 样 的 字符 ， 然 
后 用 print 语 句 看 看 后 从 得 到 了 什么 《请 读者 目 行 完成 〉。 


目 动 转 义 是 一 个 好 事情 ， 但 是 ， 有 了 时候 不 需要 转 义 ， 比 如 想 在 模板 
中 这 样 做 : 

















<!IDOCTYPE html> 
<head> 
<meta charset="UTF-8"> 
<meta name="viewport" content="width=device-width, initial-scale=1" /> 
<title>Learning Python</title> 
</head> 
<body> 
<h2> 登 录 页 面 


</h2> 
<p> 用 用 户 名 为 : 


























{{uSer}} 登 录 


</p> 
<form method="POST"> 
<p><span>UserName:</span><input type="text" id="username"/></p> 
<p><span>Password:</span><input type="password" id="password" /></p> 
<p><input type="BUTTON" value=" 登 录 


" id="login" /></p> 
</form> 
{% set website = "<a href='http://www.itdiffer.com'>welcome to my website</a>" 
{{ website }} 
<script src="{{static _ url("js/jquery.min.js")}}"></script> 
<script src="{{static url("js/script.js")}}"></script> 
</body> 


这 是 index.html 的 代码 ， 我 增加 了 {%set website="<a 
href='http://www .itdiffer.com'>welcome to my website</a>"%}， 作 用 是 设 
置 一 个 变量 ， 名 字 是 website， 它 对 应 的 内 容 是 一 个 做 了 超 链接 的 文字 。 
然后 在 下 面 使 用 这 个 变量 {{website}}， 本 希望 能 够 出 现 的 是 一 行 
字 “welcome to my website"”， 单 击 这 行 字 ， 就 可 以 打开 对 应 链接 的 网 








站 。 可 是 ， 看 到 了 如 图 8-15 所 示 的 页 面 。 


Learning Python 


人 localhost 


登录 页 面 
由 用 用 户 名 为 ; qiwsir 登 录 
UserName: 
Password: 


登录 


<a href="http://www.itdiffer.com'>welcome to my website</a> 





图 8-15 ”自动 转 义 的 结果 


下 面 那 一 行 把 整个 源码 都 显示 出 来 了 ， 这 就 是 自动 转 义 的 结果 。 这 
里 需要 的 是 不 转 义 。 于 是 可 以 将 {{website}} 修 改 为 : 


{% raw website %} 








A 0 ee 
2 


如 果 你 要 全 转 义 ， 可 以 使 用 : 


{% autoescape None %} 
{{ website }} 





貌似 省 事 ， 但 是 并 不 推荐 使 用 。 
将 下 面 几 个 函数 放 在 这 里 备查 ， 或 许 在 某 些 时 候 会 用 到 ， 都 是 可 以 
使 用 在 模板 中 的 。 


。 escape (s) : 蔡 换 字符 串 s 中 的 &、<、> 为 他 们 对 应 的 HTML 字 符 。 
。 url_escape (s) : 使 用 urllib.quote_plus 蔡 换 字符 串 s 中 的 字符 为 url 编 


码 形式 。 

。 json_encode (val) : 将 val 编 码 成 JSON 格 式 。 

。 squeeze (s) : 过 滤 字 符 串 s， 把 连续 的 多 个 空白 字符 蔡 换 成 一 个 空 
格 。 


8.3.9 ”模板 继承 


用 前 面 的 方法 已 经 能 够 很 顺利 地 编写 模板 了 。 如 果 读 者 留心 一 下 ， 
会 觉得 每 个 模板 都 有 相同 的 内 容 ， 遇 到 这 种 问题 ， 作 为 程序 员 应 该 想 
到 “继承 ?， 它 的 作用 之 一 就是 能 够 让 代码 重用 。 

在 Tornado 的 模板 中 ， 也 能 继承 。 


先 建立 一 个 文件 ， 命 名 为 base.html， 代 人 码 如 下 : 





<!IDOCTYPE html> 
<html> 
<head> 
<meta charset="UTF-8"> 
<meta name="viewport" content="width=device-width, initial-scale=1" /> 
<title>Learning Python</title> 
</head> 
<body> 
<header> 
{% block header %}{% end %} 
</header> 
<content> 
{% block body %}{% end %} 
</content> 
<footer> 
{% set website = "<a href='http://www.itdiffer.com'>welcome to my website</ 
{% raw website %} 
</footer> 
<script src="{{static _ url("js/jquery.min.js")}}"></script> 
<script src="{{static url("js/script.js")}}"></script> 
</body> 
</html> 


接 下 来 就 以 base.html 为 父 模板 ， 依 次 改写 index.html 模 板 和 user.html 
模板 。 


index.html 代 人 码 如 下 : 


{% extends "base.html" %} 


{% block header %} 
<h2> 登 录 页 面 


</h2> 
<p> 用 用 户 名 为 : 














{{uSser}} 登 录 


</p> 
{% end %} 
{% block body %} 
<form method="POST"> 
<p><span>UserName:</span><input type="text" id="username"/></p> 
<p><span>Password:</span><input type="password" id="password" /></p> 
<p><input type="BUTTON" Value=" 登 录 


" id="login" /></p> 
</form> 
{% end %} 


user.html 的 代码 如 下 : 


{% extends "base.html" %} 


{% block header %} 
<h2>Your informations are:</h2> 
{% end %} 


{% block body %} 
<ul> 
{% for one in users %} 
<li>username:{{one[1]}}</1i> 
<l1i>password:{{one[2]}}</1i> 
<li>email:{{one[3]}}</1i> 
{% end %} 
</ul> 
{% end %} 


以 上 代码 已 经 没有 以 前 重复 的 部 分 
了 。“{%extends"base.html"%}” 意 味 着 以 base.html 为 父 模 板 。 在 base.html 
中 规定 了 形式 如 同 “{%block header%}{%end%}” 这 样 的 块 语句 ， 在 
i html 中 ， 分 别 对 块 语句 中 的 内 容 进 行 了 重 写 (或 者 说 是 
ce 这 束 相 当 于 在 base. html 中 做 了 一 个 结构 ， 在 子 模板 中 按照 这 个 
具 门 合 。 








8.3.10 CSS 





基本 的 流程 已 经 差不多 了 ， 如 果 要 美化 前 端 ， 还 需要 使 用 css， 它 
的 使 用 方法 跟 js 类 似 ， 也 是 在 静态 目录 中 建立 文件 即 可 。 然 后 把 下 面 这 
名 加 入 到 base.html 的 <head></head> 中 : 





<link rel="stylesheet" type="text/css" href="{{static url("css/style.css")}}"> 


当然 ， 要 在 style.css 中 写 一 个 样式 ， 比 如 : 


body { 
color:red; 


} 


然后 看 看 前 端 显示 什么 样子 了 ， 如 图 8-16 所 示 。 
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localhost 


用 用 户 名 为 : qiwsir 登 录 


UserName: 


Password: 


登录 


Welcome to mV website 





图 8-16 ”前 端 显示 


至 于 其 他 关于 CSS 方 面 的 内 容 ， 就 不 重点 讲解 了 ， 读 者 可 以 参考 关 
于 CSS 的 资料 。 


至 此 ， 一 个 简单 的 基于 Tornado 的 网 站 就 做 好 了 ， 虽 然 它 很 丑 ， 但 


是 它 很 有 前 途 。 因 为 读者 只 要 按照 上 述 的 讨论 ， 就 可 以 在 里 面 增加 各 种 
目 己 认为 可 以 增加 的 内 容 。 


建议 读者 在 学 习 以 上 内 容 基础 上 ， 可 以 继续 完成 下 面 的 几 个 功能 : 








。 用 户 注册 。 

。 用 户 发 表 文章 。 

。 用 户 文章 列表 ， 并 根据 文章 标题 得 看 文章 内 容 。 
。 用 户 重 新 编辑 文章 。 


8.3.11 cookie 和 安全 








cookie 是 现在 网 站 重要 的 内 容 ， 特 别 是 当 有 用 户 登 录 的 时 候 ， 所 以 
需要 学 习 了 解 cookie。 维 基 百 科 如 是 说 : 


cookie 〈 复 数 形 态 cookies) ， 中 文 名 称 为 小 型 文本 文件 或 小 甜 饼 ， 
间 菜 些 网 站 为 了 辨别 用 户 身份 而 储存 在 用 户 本 地 终端 (Client Side) 上 
的 数据 (通常 经 过 加 密 ) 。 定 义 于 RFC2109。 是 网 景 公司 的 前 雇员 Lou 
Montulli 在 1993 年 3 月 发 明 的 。 


关于 cookie 的 作用 ， 维 基 百 科 说 得 非常 详细 : 


因为 HTTP 协议 是 无 状态 的 ， 即 服务 器 不 知道 用 户 上 一 次 做 了 什 
么 ， 这 严重 阻碍 了 交互 式 Web 应 用 程序 的 实现 。 在 典型 的 网 上 购物 场景 
中 ， 用 户 浏 览 了 几 个 页 面 ， 买 了 一 盒 饼干 和 两 瓶 饮料 。 最 后 结账 时 ， 由 
于 HITP 的 无 状态 性 ， 不 通过 额外 的 手段 ， 服 务 器 并 不 知 着 用 户 到 诬 买 
了 什么 。 所 以 cookie 就 是 用 来 绕 开 HITP 的 无 状态 性 的 “额外 手段 ?之 一 。 
2 
话 中 的 状态 。 


在 刚才 的 购物 场景 中 ， 当 用 户 选 购 了 第 一 项 商品 ， 服 务 器 在 同 用 户 
发 送 网 页 的 同时 ， 还 发 送 了 一 段 cookie， 记 录 着 那 项 商品 的 信息 。 当 用 
户 访问 另 一 个 页 面 ， 浏 览 器 会 把 cookie 发 送 给 服务 器 ， 于 是 服务 器 就 知 
道 他 之 前 选 购 了 什么 。 用 户 继 续 选 购 饮料 ， 服 务 硕 就 在 原来 那 段 cookie 
里 退 加 新 的 商品 信息 。 结 账 时 ， 服 务 吉 该 取 发 送 来 的 cookie 就 行 了 。 




















cookie 男 一 个 典型 的 应 用 是 ， 当 登录 一 个 网 站 时 网 站 往往 会 请 求 用 
户 输入 用 户 名 和 密码 ， 并 且 用 户 可 以 义 选 “下 次 目 动 登录 ”。 如 果 义 选 
了 了， 那么 下 次 访问 同一 网 站 时 ， 用 户 会 发 现 没 输入 用 户 名 和 密码 就 已 经 
登录 了 。 这 正 是 因为 前 一 次 登录 时 ， 服 务 器 发 送 了 包含 登录 凭据 〈 用 户 
名 加 密码 的 某 种 加 密 形 式 ) 的 cookie 到 用 户 的 硬盘 上 。 第 二 次 登录 时 
(如 有 果 该 cookie 尚 未 到 期 ) 浏览 器 会 发 送 该 cookie 服 务 器 验证 凭据 ， 于 
是 不 必 输 入 用 户 名 和 密码 就 让 用 户 登 录 了 。 


cookie 也 有 缺陷 ， 比 如 来 自 伟 大 的 维基 百科 也 列 出 了 三 条 


。 cookie 会 被 附加 在 每 个 HTTP 请 求 中 ， 所 以 无 形 中 增加 了 流量 。 

。 由 于 在 HTTP 请 求 中 的 cookie 是 明文 传递 的 ， 所 以 安全 性 成 问题 ( 除 
韭 用 HTTPS) 。 

。 cookie 的 大 小 限制 在 4KB 左 右 ， 或 许 在 某 些 情况 下 有 点 不 够 用 。 


对 于 用 户 来 说 ， 可 以 通过 改变 浏览 器 的 设置 来 禁用 cookie， 也 可 以 
删除 历史 的 cookie。 但 就 目前 而 言 ， 大 多 数 人 都 不 再 禁用 cookie 了 。 


cookie 最 让 人 担心 的 还 是 由 于 它 存 储 了 用 户 的 个 人 信息 ， 并 且 最 终 
这 些 信息 要 发 给 服务 器 ， 那 么 它 束 会 成 为 某 些 人 的 目标 或 者 工具 ， 比 如 
有 cookie 盗 贼 ， 就 是 搜集 用 户 cookie， 然 后 利用 这 些 信息 进入 用 户 账 
号 ， 达 到 个 人 某 种 不 可 告 人 之 目的 ， 还 有 被 称 之 为 cookie 投 毒 的 说 法 ， 
是 利用 客户 端的 cookie 传 给 服务 器 的 机 会 ， 修 改 传 回去 的 值 。 这 些 行为 
常常 是 通过 一 种 被 称 为 “ 跨 站 指令 脚本 (Cross site scripting ) ”( 或 者 跨 
站 指令 码 ) 的 行为 方式 实现 的 。 伟大 的 维基 百科 这 样 解释 了 跨 站 脚本 : 


跨 网 站 脚本 (Cross-site scripting， 通 常 简 称 为 XSS 或 跨 站 脚本 或 跨 
站 脚本 攻击 ) 是 一 种 网 站 应 用 程序 的 安全 漏洞 攻击 ， 是 代码 注入 的 一 
种 。 它 允 许 8 其 他 用 户 在 观看 网 页 时 束 会 
受到 影响 。 这 类 攻击 通常 包含 HTML 和 用 户 端 脚本 语言 。 


XSS 攻 击 通 常 指 的 是 利用 网 页 开发 时 留 下 的 漏洞， 通过 巧妙 的 方法 
注入 恶意 指令 代码 到 网 页 ， 使 用 户 加 载 并 执行 攻击 者 恶意 制造 的 网 页 程 
序 。 这 些 亚 意 网 页 程序 通 各 是 JavaScript， 但 实际 上 也 可 以 包括 Java. 
VBScript、ActiveX、Flash 或 者 是 普通 的 HIML 。 攻 击 成 功 后 ， 攻 击 者 可 
能 得 到 更 高 的 权限 “如 执行 一 些 操作 ) 、 私 密 网 页 内 容 、 会 话 和 cookie 
等 各 种 内 容 。 












































对 cookie 的 普 过 使 用 ， 用 户 和 网 站 都 受益 了 ， 但 也 要 防止 有 人 用 它 


作恶 


“CA 


在 Tornado 中 ， 也 提供 对 cookie 的 读 写 函数 ， 帮 助 我 们 管理 和 使 用 
set_cookie() 和 get_cookie() 是 默认 提供 的 两 个 方法 ， 但 它 是 明文 不 加 
密 传输 的 。 


在 index.py 文 件 的 IndexHandler 类 的 post(0) 方 法 中 ， 当 用 户 登 录 ， 验 
证 用 户 名 和 密码 后 ， 将 用 户 名 和 密码 存 入 cookie， 代 码 如 下 : 








def post(self): 

username = self.get_argument("username") 
password = self.get_argument("password") 
user_infos = mrd,.select_ table(table="users", column="*", condition="username", 
if user_infos: 

db_pwd = user_infos[0][2] 

if db_pwd == password: 

self.set_ cookie(username, db_pwd) # 设 置 























cookie 
self .write(username) 
else: 
self.write("your password was not right.") 
else: 
self.write("There is no thi user.") 


上 面 代码 中 ， 较 以 前 只 增加 了 一 句 “‘self.set_cookie (username， 


看 图 8-17 中 稍 头 所 指 ， 从 左 开 始 的 第 一 个 是 用 户 名 ， 第 二 个 是 存储 
J 密码 。 将 我 在 登录 时 输入 的 密码 以 明文 的 方式 存储 在 cookie 里 
Fs 


明文 存储 ， 显 然 不 安全 。 


Tornado 提 供 男 外 一 种 安全 的 方法 : set_secure_cookie() 和 
get_secure_cookie()， 之 所 以 称 其 为 安全 cookie， 是 因为 它 以 明文 加 密 的 
方式 传输 。 此 外 ， 跟 set_cookie() 的 区 别 还 在 于 ，set_secure_cookie() 执 行 
后 的 cookie 保 存在 磁盘 中 ， 直 到 和 它 过 期 为 止 。 也 是 因为 这 个 原因 ， 即 使 
关闭 浏览 器 ， 在 失效 时 间 以 前 ，cookie 都 一 直 存 在 。 
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全 localhost 


Your informations are: 
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。 Username:qiwsir 
es。 password:123123 
» email:qiwsir@gmail.com 





welcome to my website 
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4 qiwsir | ] localhost 12 日 
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图 8-17 回 到 登录 页 面 











要 是 用 set_secure_cookie() 方 法 设置 cookie， 要 先 在 application.py 文 
件 的 setting 中 进行 如 下 配置 : 


setting = dict( 
template path = os.path.join(os.path.dirname(_ file ), "templates"), 
static path = os.path.join(os.path.dirname(_ file ), "statics"), 
cookie_secret = "bzJc2swWbQLKos6GKkHn/VB9oXwQt8SOROKRVJ5/XJ89E="， 
) 


其 


一 


中 “cookie _secret="bZJc2sWbQLKos6GkHn/VB9oXwQt8SOROKkRvJ5/xJ89E 
为 此 增加 的 ， 但 是 ， 它 并 不 是 真正 的 加 密 ， 仪 仪 是 一 个 障 眼 法 办 了 。 


因为 tornado 会 将 cookie 值 编码 为 Base-64 字 符 串 ， 并 增加 一 个 时 间 戳 
和 一 个 cookie 内 容 的 HMAC 签 名 。 所 以 ，cookie_secret 的 值 ， 和 常常 用 下 面 
的 方式 生成 (这 是 一 个 随机 的 字符 串 )〉: 








>>> import base64, uuid 
>>> base64.b64encode(uuid.uuid4().bytes) 
'w8yZud+kRHiP9UABEXaQiA==" 


如 采 嫌 和 弃 上 面 的 签名 短 ， 可 以 
用 “base64.b64encode 〈uuid.uuid40.bytes+uuid.uuid40.bytes) ”获取 。 这 
里 得 到 的 是 一 个 随机 字符 串 ， 用 它 作 为 cookie_secret 值 。 
然后 修改 index.py 中 设置 cookie 那 句 话 ， 变 成 : 
self.set_secure_cookie(username, db_pwd) 
重新 跑 一 个 ， 效 果 如 图 8-18 所 示 。 
啊 哈 ， 果 然 “ 密 ”了 很 多 。 


如 果 要 获取 此 cookie， 用 self.get_secure_cookie (username) 即 可 。 





~ 


localhost 


宕 Your informations are: 


_ ). es USsername:glwsir 


es。 password:123123 
。 email:qiwsir@gmail.com 


Welcome to my website 





sole HTML C55 Scrip 
” C ies ”Filter » Default (Accept cookies) ~ 


二 Value 
3 qiwsir 


Value 


“211:9116:143273671416:qiwsir18:MTIZHTIzlecff9a4666197da3f2d9c4f72456a3c364f6ced73253d9bc42e4fe416a6 
ee326” 





图 8-18 ”修改 后 效果 图 


这 样 是 不 是 就 安全 了 ? 如 果 这 样 就 安全 了 ， 那 你 也 太 低 估 黑 客 们 的 
技术 实力 了 ， 甚 至 于 用 户 自 己 也 会 修改 cookie 值 。 还 要 更 安全 ， 所 以 又 
有 了 httponly 和 secure 属 性 ， 用 来 防范 cookie 投 毒 。 设 置 方法 是 : 








self.set_secure cookie(username, db_pwd, httponly=True, secure=True) 


要 获取 cookie， 可 以 使 用 self.set_secure_cookie (username) 方法 ， 
将 这 人 句 放 在 user.py 中 某 个 适合 的 位 置 ， 并 且 可 以 用 print 语 名 打印 出 结 
果 ， 束 能 看 到 变量 username 对 应 的 cookie 了 。 这 时 候 已 经 不 是 那 
个 “ 密 ” 过 的 ， 是 明文 显示 。 


用 这 样 的 方法 ， 浏 览 器 通过 SSL 连 接 传递 cookie， 能 够 在 一 定 程 度 
上 防范 跨 站 脚本 攻击 。 


8.3.12 XSRF 


XSRE 的 含义 是 Cross-site request forgery， 即 跨 站 请 求 伪 造 ， 也 称 之 
为 “one click attack”， 通 常 缩写 成 CSREF 或 者 XSRFE， 可 以 读 作 ”sea surf”。 
这 种 对 网 站 的 攻击 方式 跟 上 面 的 跨 站 脚本 (XSS) 似乎 相像 ， 但 攻击 方 
式 不 一 样 。XSS 利 用 站 点 内 的 信任 用 户 ， 而 XSRF 则 通过 伪装 来 目 受 信 
任用 户 的 请 求 而 利用 受信 任 的 网 站 。 与 XSS 攻 击 相 比 ，XSRF 攻 击 往往 
不 大 流行 〈 因 此 对 其 进行 防范 的 资源 也 相当 稀少 ) 和 难以 防范 ， 所 以 被 
认为 比 XSS 更 具 和 危险 性 。 


还 有 一 点 需要 提醒 读者 ， 即 在 开发 应 用 时 需要 深 谋 远虑 。 任 何 会 产 
副作用 的 HITP 请 求 ， 比 如 单 击 购买 按钮 、 编 辑 账 户 设 置 、 改 变 密码 
或 删除 文档 等 都 应 该 使 用 postO 方 法 ， 这 是 良好 的 RESTful 做 法 。 


又 一 个 新 名 词 : REST。 这 是 一 种 Web 服 务实 现 方案 。 伟 大 的 维基 
百科 中 这 样 描述 : 


表征 性 状态 传输 (英文 : Representational State Transfer， 简 称 
REST) 是 Roy Fielding 博 士 在 2000 年 他 的 博士 论文 中 提出 来 的 一 种 软件 
架构 风格 。 目 前 在 三 种 主流 的 Web 服 务实 现 方案 中 ， 因 为 REST 横 式 与 
复杂 的 SOAP 和 XML-RPC 相 比 更 加 简洁 ， 越 来 越 多 的 Web 服 务 开始 采用 
REST 风 格 设计 和 实现 。 例 如 ，Amazon.com 提 供 接近 REST 风 格 的 Web 服 
务 进 行 图 书 碍 找 ; 雅虎 提供 的 Web 服 务 也 是 REST 风 格 的 。 


在 Tornado 中 还 提供 了 XSRF 保 护 的 方法 。 
在 application.py 文 件 中 使 用 xsrf_cookies 参 数 开 启 XSRF 保 护 。 








setting = dict( 
template_path = os.path.join(os.path.dirname(__file ), "templates"), 
static_path = os.path.join(os.path.dirname(_ file ), "statics"), 
cookie_ secret = "bzJc2swbQLKos6GkHn/VB9oXwQt8SOROKRVJ5/XJ89E="， 
xsrf_cookies = True, 


这 样 设 置 之 后 ，Tornado 将 拒绝 请 求 参数 中 不 包含 正确 的 _xsrf 值 的 
post/put/delete 请 求 。Tornado 会 在 后 面 悄悄 地 处 理 _xsrf cookies， 所 以 ， 
在 表单 中 也 要 包含 XSREF 令 牌 以 确保 请 求 合 法 。 比 如 index.html 的 表单 ， 
修改 如 下 : 


{% extends "base.html" %} 
{% block header %} 
<h2> 登 录 页 面 


</h2> 
<p> 用 用 户 名 为 : 





























{{uSer}} 登 录 


</p> 

{% end %} 

{% block body %} 

<form method="POST"> 

{% raw xsrf_form_html() %} 
<p><span>UserName:</span><input type="text" id="username"/></p> 
<p><span>Password:</span><input type="password" id="password" /></p> 
<p><input type="BUTTON" value=" 登 录 


" id="login" /></p> 
</form> 
{% end %} 


“{%raw xsrf_form_html09%}2? 是 新 增 的 ， 目 的 束 在 于 实现 上 面 所 说 
的 授权 给 前 端 以 合法 请 求 。 


前 端 向 后 端 发 送 的 请 求 是 通过 Ajax0， 所 以 ， 在 Ajax 请 求 中 ， 需 要 
一 个 _xsrf 参 数 。 


以 下 是 script.js 的 代码 : 








function getCookie(name){ 
var x = document.cookie.match("\\b" + name + "=([^;]*)\\b"); 
return x ? x[1]:undefined ， 


$(document).ready(function(){ 
$("#1l0gin").click(function(){ 
Var user = $("#username").val(); 
var pwd = $("#password").val(); 
var pd = {"username":user, "password":pwd, "_xsrf":getCookie(" xsrf")}; 
$.ajax({ 
type:"post", 


Ur /™s 

data:pd, 

cache:false, 

success:function(data)t 
window.location.href = "/user?user="+data; 

}, 

error:function(){ 
alert("error!"); 

}, 

}); 
}); 
}); 


函数 getCookie0 的 作用 是 得 到 cookie 值 ， 然 后 将 这 个 值 放 到 向 后 端 
post 的 数据 中 “var pd= 
{"username":user, "password":pwd, "_xsrf":getCookie (" xsrf") };”。 运 


行 的 结果 如 图 8-19 所 示 。 
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welcome to my website 


3 


LU 
后) 
By 


| 


WW《 >》 站 consols CSS Script DOM Net | Cookiesv | 


村 
| 


= 外 本 全 尖 


s Cookies » Filter > ult (Accept cookies) > 


Name 
xsf 


Value 
2|baB2cebc |99e47b3159699985d81f2bfa4e3915bd|1432782971 


qiwsir 





图 8-19 ”运行 结果 


这 是 Tornado 提 供 的 XSRF 防 护 方法 。 是 不 是 这 样 做 就 高 枕 无 忧 了 





呢 ? 世界 是 复杂 的 ， 要 做 好 一 个 网 站 ， 需 要 考虑 的 事情 还 很 多 。 


常常 听 到 人 说 做 个 网 站 怎么 简单 ， 客 户 用 这 种 说 辞 来 压低 价格 ， 老 
板 用 这 种 说 辞 来 缩短 工时 成 本 ， 从 上 面 的 简单 叙述 中 ， 你 还 党 得 网 站 是 
页面 就 完事 儿 的 吗 ? 除非 那个 网 站 不 是 给 人 看 的 ， 而 是 在 那里 
时 








8.3.13 ”用户 验证 


用 户 登 录 之 后 ， 当 翻 到 别 的 网 页 中 时 ， 往 往 需要 验证 用 户 是 否 处 于 
登录 状态 。 当 然 ， 一 种 比较 直接 的 方法 ， 束 是 在 转 到 每 个 目录 时 ， 都 从 
Cookie 中 把 用 户 信 息 传 到 后 端 ， 跟 数据 库 验 证 。 这 不 仅 是 直接 的 ， 也 是 
基本 的 流程 。 但 是 ， 如 果 这 个 过 程 总 让 用 户 自 己 来 做 ， 框 架 的 作用 就 显 
不 出 来 了 。Tornado 束 提供 了 一 种 用 户 验 证 方法 。 

为 了 后 面 更 工程 化 地 使 用 Tornado 编 程 ， 需 要 将 前 面 已 经 有 的 代码 
进行 重新 梳理 。 下 面 只 是 将 有 修改 的 文件 代码 写 出 来 ， 不 做 过 多 解释 ， 
必要 的 有 注释 ， 相 信 读 者 在 学 习 前 面 内 容 的 基础 上 能 够 理解 。 


在 handler 目 录 中 增加 一 个 文件 ， 名 称 是 base.py， 代 人 码 如 下 : 





#! /usr/bin/env python 
# coding=utf-8 


import tornado.web 
class BaseHandJer(tornado ,web ,RequestHandler ) : 


def get_current_user(self): 
return self.get_secure cookie("user") 











在 这 个 文件 中 ， 目 前 只 做 一 件 事情 ， 就 是 建立 一 个 名 为 BaseHandler 
的 类 ， 然 后 在 里 面 放 置 一 个 方法 ， 束 是 得 到 当前 的 Cookie。 在 这 里 要 特 
别 同 读者 说 明 ， 在 这 个 类 中 ， 其 实 还 可 以 写 很 多 别 的 东西 ， 比 如 你 可 以 
将 数据 库 连 接 写 到 这 个 类 的 初始 化 _init_0 方 法 中 。 因 为 在 其 他 的 类 
要 继承 这 个 类 。 所 以 ， 这 样 一 个 架势 就 为 读者 以 后 的 扩展 增加 

J ls 


然后 把 index.py 文 件 改 写 为 : 





#!/UsSr/bin/env python 
# coding=utf-8 


Import tornado ,escape 
import methods ,readdb as mrd 
from base import BaseHandler 


class IndexHandler(BaseHandler ): # 继 承 





base .py 中 的 类 


BaseHandler 
def get(self): 
usernames = mrd,.select_ columns(table="users",column="username") 
one_user = usernames[0][90] 
self.render("index.html", user=one_user) 


def post(self): 

username = self.get_argument("username") 
password = self.get_argument("password") 
user_infos = mrd.select table(table="users", column="*", condition="usernam 
If user_infos : 

db_pwd = user_infos[0][2] 

if db_pwd == password: 

self.set_current_user (username) # 将 当前 用 户 名 写 入 

















cookie 
self .write(username) 
else: 
self.write("-1") 
else: 
self .write("-1") 


def set_current_ user(self, user): 
if user: 
# 注 意 这 里 使 用 ] 












































tornado.escape.json_encode( ) 方 法 


self,set_secure cookie('user', tornado.escape.json_encode(user)) 
else: 


self.clear_cookie("user") 











class ErrorHandler(BaseHandler): # 增 加 了 一 个 专门 用 来 显示 错误 的 页 面 














def get(self): 
self.render("error.html") 


在 index.py 的 类 IndexHandler 中 ， 继 承 了 BaseHandler 类 ， 并 且 增 加 了 
一 个 方法 ，set_current_user() 用 于 将 用 户 名 写 入 Cookie。 请 读者 特别 注意 


tornado.escape.json_encode() 方 法 ， 其 功能 是 : 


tornado.escape.json_encode(value) JSON-encodes the given Python object. 


如 果 要 但 看 源码 ， 可 以 阅读 : 


http:/www.tornadoweb.org/en/branch2.3/escape.html。 


这 样 做 的 本 质 是 把 user 转 化 为 json， 写 入 到 了 Cookie 中 。 如 果 从 
Cookie 中 把 它 读 出 来 ， 使 用 user 的 值 时 ， 还 会 用 到 : 





tornado.escape.json decode(value) Returns Python objects for the given JSON string 
它们 与 json 模 块 中 的 dump0、load0) 功 能 相仿 。 
接 下 来 要 对 user.py 文 件 也 进行 重 写 : 


#!/UsSr/bin/env python 
# coding=utf-8 


Import tornado ,web 

import tornado ,escape 

import methods .readdb as mrd 
from base import BaseHandler 


class UserHandler (BaseHandler): 
Q@tornado .web .authenticated 
def get(self): 
#uUsername = self.get_argument("user") 
Username = tornado.escape.json decode(self.current_user) 
user_infos = mrd.select table(table="users", column="*", condition="usernam 
self,.render("user.htm]l", users = user_infos) 





在 get0 方 法 前 面 添 加 @tornado.web. ns 这 是 一 个 装饰 
器 ， 它 的 作用 束 是 完成 Tornado 的 认证 功能 ， 即 能 够 得 到 当前 合法 用 
户 。 在 原来 的 代码 中 ， 用 username= 和 Cuser" ) 方法 ， 从 
url 中 得 到 当前 用 户 名 ， 现 在 把 它 注释 掉 ， 改 用 self.current_user， 这 是 和 
前 面 的 装饰 器 配合 使 用 的 ， 如 果 它 的 值 为 假 ， 就 根据 setting 中 的 设置 ， 
寻找 login_url 所 指定 的 目录 (请 关注 下 面 对 setting 的 配置 )。 


由 于 在 index.py 文 件 的 set_current_user() 方 法 中 ， 是 将 user 值 转化 为 
json 写 入 Cookie 的 ， 这 里 就 得 用 
username=tornado.escape.json_decode (self.current_user) 解码 。 得 到 的 


username 值 ， 可 以 被 用 于 后 一 句 中 的 数据 库 碍 询 。 














application.py 中 的 setting 也 要 做 相应 修改 : 


#!/UsSr/bin/env python 
# coding=utf-8 


from url import Url 


import tornado,web 
import os 


setting = dict( 
template_ path = os.path.join(os.path.dirname(_ file ), "templates"), 
static path = os.path.join(os.path.dirname(_ file ), "statics"), 
cookie_secret = "bzJc2SswWbQLKos6GKkHn/VB9oXwQt8SOROKRVJ5/XJ89E="， 
xsrf_cookies = True， 
login url = '/ 

) 


application = tornado.web.Application( 
handlers = url, 
**setting 


) 


2 ”如 果 用 户 不 合法 ， 根 
据 这 个 设置 ， 会 返回 到 首页 。 当 然 ， 如 果 有 单独 的 登录 界面 ， 比 
人 也 可 以 login_url=vlogin'。 


如 此 完成 的 是 用 户 登 录 到 网 站 之 后 ， 在 页 面 转换 的 时 候 实现 用 户 认 





证 。 


8.3.14 ”相关 概念 


1. 同 步 和 异步 


有 不 少 资料 对 这 两 个 概念 做 了 不 同 角度 和 层面 的 解释 。 在 我 来 看 ， 
最 典型 的 例子 惑 是 打 电 话 和 发 短信 。 


打 电 话 就 是 同步 。 = 0 当 
这 个 信息 被 张 三 太 出 ， 提 交 给 李 四 ， 李 四 的 啊 应 (一 般 会 听 
a 或 者 “不 是 ”) ， 内 有 得 到 了 村 返回 的 信息 之 后 ， 才能 进行 后 
续 的 信息 传送 。 


发 短信 和 是 异步 。 张 三 给 李 四 发 短信 ， 编 辑 了 一 句 话 “ 今 晚 一 起 看 老 








齐 的 《 零 基础 学 python》”， 发 送 给 李 四 。 李 四 或 许 马 上 回复 ， 或 许 过 
一 段 时 间 才 回复 ， 这 段 时 间 有 多 长 不 一 定 。 总 之 ， 李 四 不 管 什么 时 候 回 
复 ， 张 三 会 以 听 到 短信 铃声 为 提示 奏 看 短信 。 


以 上 方式 理解 < 同步 ?和 “异步 ?不 是 很 精准 ， 有 些 地 方 或 许 有 牵强 。 
要 尺 名 理解 ， 需 要 用 产 述 一 反 的 定义 表 还 《以 下 表 认 参照 了 知 于 二 的 
回答 ) : 


同步 和 异步 关注 的 是 消息 通信 机 制 (synchronous 
communication/asynchronous communication) 。 


”所 请 同步 ， 就 是 在 发 出 一 个 “调用 * 时 ， 在 没有 得 到 结 末 之 前 ， 
该 “调用 ”就 不 返回 。 但 是 一 旦 调用 返回 ， 就 得 到 返回 值 了 。 换 句 话 说 ， 
就 是 由 “调用 者 ”主动 等 竺 这 个 “调用 ”的 结果 。 


异步 则 相反 ,“ 调 用 "在 发 出 之 后 ， 就 直接 返回 了 ， 所 以 没有 返回 
结果 。 换 名 话说 ， 当 一 个 异步 过 程 调 用 发 出 后 ， 调 用 者 不 会 立刻 得 到 结 
果 。 而 是 在 “调用 ?发 出 后 , “被 调用 者 ”通过 状态 、 通 知 来 通知 调用 者 ， 
或 通过 回调 函数 处 理 这 个 调用 。 


可 能 还 是 前 面 的 打 电 话 和 发 短信 更 好 理解 。 

















2. 阻 塞 和 非 阻 吉 


“阻塞 和 非 阻塞 "与 “同步 和 异步 ? 常 癌 被 混为一谈 ， 其 实 它 们 之 间 还 
是 有 差别 的 。 如 果 按 照 一 个 “差不多 ”先生 的 思维 方法 ， 你 也 可 以 不 那么 
深究 它们 之 间 学 理 上 的 差 踊 ， 反 正在 你 的 程序 中 ， 会 使 用 就 可 以 了 。 不 
过 ， 必 要 的 严谨 还 是 需要 的 ， 特 别 是 本 书 中 ， 要 装扮 的 让 别人 看 来 目 己 
懂 ， 于 是 就 再 引用 知 乎 上 的 说 明 : 


P0002 

















阻 豆 调用 是 指 调用 结果 返回 之 前 ， 当 前 线程 会 被 挂 起 ， 调 用 线程 只 
有 在 得 到 结果 之 后 才 会 返回 。 非 阻塞 调用 是 指 在 不 能 立刻 得 到 结果 之 
前 ， 该 调用 不 会 阻塞 当前 线程 。 


按照 这 个 说 明 ， 发 短信 显然 融 是 非 阻塞 ， 发 出 去 一 条 短信 之 后 ， 你 








利用 手机 还 可 以 干 别 的 ， 乃 至 于 再 发 一 条 “ 老 齐 的 课程 没意思 ， 还 是 看 
PHP 刺 激 ” 也 是 可 以 的 。 


关于 这 两 组 基本 概念 的 辨析 ， 不 是 本 教程 的 重点 ， 读 者 可 以 参阅 这 
A 文章 : 

http://www.cppblog.com/converse/archive/2009/05/13/82879.html， 文 章 作 
者 做 了 细致 入 微 的 辨析 。 


8.3.15 ”Tormnado 的 同步 


此 前 ， 在 Tornado 基 础 上 已 经 完成 的 Web 束 是 同步 的 、 阻 塞 的 。 为 
了 更 明显 地 感受 这 一 点 ， 不 妨 这 样 试 一 试 。 


在 handlers 文 件 夹 中 建立 一 个 文件 ， 命 名 为 sleep.py。 


#!/Uusr/bin/env python 
# coding=utf-8 


from base import BaseHandler 

import time 

class SleepHandler (BaseHandler ) : 
def get(self): 


time.sleep(17) 
self.render("sleep.html") 


class SeeHandler (BaseHandler ) : 
def get(self): 
self.render("see.html") 


sleep.html 和 see.html 是 两 个 简单 的 模板 ， 内 容 可 以 自己 写 。 别 态 记 
修改 url.py 中 的 目录 。 


然后 测试 稍微 复杂 一 点 ， 打 开 浏览 器 之 后 ， 打 开 两 个 标签 ， 分 别 在 
两 个 标签 中 输入 localhost:8000/sleep( 记 为 标签 1) 和 
localhost:8000/see ( 记 为 标签 2) ， 注 意 我 用 的 是 8000 端 口 。 输 入 之 后 先 
不 要 单 击 回 车 访问 。 做 好 准备 ， 记 住 切换 标签 可 以 用 “ctrl-tab” 组 合 键 。 


1. 执 行 标签 1， 让 它 访 问 网 站 。 


2. 马 上 切换 到 标签 2， 访 问 网 址 。 


3 .注意 观察 ， 两 个 标签 页 面 ， 是 不 是 都 在 显示 "正在 访问 ， 请 等 
待 ”。 


4. 当 标签 1 不 呈现 等 待 提示 《比如 一 个 正在 转 的 圆圈 ) 时， 标签 2 的 
表现 如 何 ? 几乎 同时 也 访问 成 功 了 。 


建议 读者 修改 sleep.py 中 的 time.sleep 〈17) 这 个 值 ， 多 试 试 。 


当然 ， 这 是 比较 笨拙 的 方法 ， 可 以 通过 测试 工具 完成 上 述 操作 比 
较 。 

















8.3.16 ”异步 设置 


Tornado 本 来 就 是 一 个 异步 的 服务 框架 ， 体 现在 Tornado 的 服务 器 和 
客户 端的 网 络 交 互 的 异步 上 ， 起 作用 的 是 tornado.ioloop.IOLoop 。 但 是 
如 果 在 客户 端 请 求 服务 器 之 后 ， 在 执行 某 个 方法 的 时 候 ， 比 如 上 面 的 代 
码 中 执行 get0) 方 法 的 时 候 ， 遇 到 了 time.sleep 〈17) 这 个 需要 执行 时 间 比 
较 长 的 操作 ， 耗 党 时 间 ， 就 会 使 整个 Tornado 服 务 器 的 性 能 受 限 。 


为 了 解决 这 个 问题 ，Tormado 提 供 了 一 套 和 异步 机 制 ， 束 是 异步 装饰 
(Otornado.web.asynchronous。 





#!/UsSr/bin/env python 
# coding=utf-8 


import tornado.web 
from base import BaseHandler 


import time 


class SleepHandler (BaseHandler ) : 
@tornado.web.asynchronous 
def get(self): 
tornado.ioloop.IOLoop.instance().add timeout(time.time() + 17, callback=sel 
def on_response(self): 
self.render("sleep.html") 
self.finish() 





将 sleep.py 的 代码 如 上 述 一 样 改造 ， 即 在 get(O 方 法 前 面 增加 了 装饰 器 


@tornado.web.asynchronous， 它 的 作用 在 于 将 Tornado 服 务 器 本 喘 默 认 的 
设置 _auto_fininsh 值 修改 为 False。 如 果 不 用 这 个 装饰 器 ， 客 户 端 访问 服 
务 器 的 get0 方 法 并 得 到 返回 值 之 后 ， 两 者 之 间 的 连接 就 断 开 了 ， 但 是 用 
了 @tornado.web.asynchronous 之 后 ， 这 个 连接 就 不 关闭 ， 直 到 执行 了 
self.finish() 才 关闭 这 个 连接 。 


tornado.ioloop.IOLoop.instance().add_timeout() 也 是 一 个 实现 异步 的 
函数 ， time'timeO+17 给 前 面 的 函数 提供 一 个 参数 ， 这 样 实 现 了 相当 于 
time.sleep 〈17) 的 功能 ， 不 过 ， 还 没有 完成 ， 当 这 个 操作 完成 之 后 ， 束 
执行 回调 函数 on_response() 中 的 self.render ("sleep.html") ， 并 关闭 连接 
self.finish()。 


所 谓 异 步 ， 就 是 要 解决 原来 的 time.sleep (17) 造成 的 服务 器 处 理 时 
间 长 、 性 能 下 降 的 问题 。 解 决 方法 如 上 描述 


读者 看 这 个 代码 ， 或 许 会 感觉 有 点 不 舒服 。 如 果 有 这 文 个 感 觉 是 正常 
的 ， 因 为 它 里 面 除 了 装饰 器 之 外 ， 用 到 了 一 个 回调 函数 ， 它 让 代码 的 逻 
辑 不 是 平 铺 下 去 ， 而 是 被 分 割 成 了 两 段 。 第 一 段 是 
tornado.ioloop.IOLoop.instance().add_timeout (time.time()+17, 
callback=self.on_response) ， 用 callback=self.on_response 来 使 用 回调 函 
数 ， 并 没有 如 同 改造 之 前 直接 self.render 〈"sleep.html") ; 第 二 段 是 回调 
函数 on_response (self) ， 要 在 这 个 函数 里 面 执行 
self.render ("sleep.html") ， 并 且 以 self.finish()` 结 尾 以 关闭 连接 。 


这 还 是 执行 简单 逻辑 ， 如 果 复 洒 了 ， 要 不 断 地 进行 “回调 ?， 无 法 让 
馆 辑 顺利 延续 ， 就 会 < 蚁 晖 > 了。 这 种 现象 被 业 界 称 为 "代码 逻辑 拆 分 ”， 
打破 了 原 有 氨 辑 的 顺序 性 。 为 了 让 代码 逻辑 不 至 于 被 拆 分 的 七 零 八 落 ， 
于 是 就 出 现 了 为 外 一 种 第 用 的 方法 : 











#!/UsSr/bin/env python 
# coding=utf-8 


import tornado.web 
import tornado ,gen 
from base import BaseHandler 


import time 


class SleepHandler(tornado.web.RequestHandler ) : 
@tornado.gen.coroutine 
def get(self): 
yield tornado.gen.Task(tornado.ioloop.IOLoop.instance().add timeout, time.t 
#yield tornado.gen.sleep(17) 


self.render("sleep.html") 


从 整体 上 看 ， 这 段 代码 避免 了 回调 函数 ， 看 大 顺利 多 了 。 
再 看 细节 部 分 。 


首先 使 用 的 是 @tornado.gen.coroutine 装 饰 器 ， 所 以 要 在 前 面 有 
import tornado.gen。 跟 这 个 装饰 器 类 似 的 是 @tornado.gen.engine 装 饰 
器 ， 两 者 功能 类 似 ， 有 一 点 细微 差别 。 请 阅读 官方 对 此 的 解释 : 


This decorator 〈 指 engine) is similar to coroutine, except it does not 
return a Future and the callback argument is not treated Specially. 


@tornado.gen.engine 是 古 时 候 用 的 ， 现 在 我 们 都 使 用 
G@tormado.gen.corroutine 了 ， 这 个 是 在 tornado 3.0 以 后 开始 用 的 。 在 网 上 
查阅 资料 的 时 候 ， 会 遇 到 一 些 使 用 @tornado.gen.engine 的 ， 但 是 在 你 使 
用 或 者 借鉴 代码 的 时 候 ， 可 以 勇敢 地 将 其 修改 为 
gen.coroutine。 有 了 这 个 装饰 器 ， 就 能 够 控制 下 面 的 生成 绒 的 
流程 了 。 


然后 就 看 到 get(0) 方 法 里 面 的 yield 了 ， 这 是 一 个 生成 器 。 “yield 
tornado.gen.Task (tornado.ioloop.IOLoop.instance().add_timeout, 
time.timeO+17) ”的 执行 过 程 ， 先 看 括号 里 面 ， 跟 前 面 的 一 样 是 来 蔡 代 
time.sleep 〈17) 的 ， 然 后 是 tornado.gen.Task0) 方 法 ， 其 作用 是 “Adapts a 
callback-based asynchronous function for use in coroutines.”( 由 于 怕 翻 译 
后 遗漏 信息 ， 所 以 引用 原文 )。 返 回 后 ， 使 用 yield 得 到 了 一 个 生成 占 ， 
先 把 流程 挂 起 ， 等 完全 完毕 再 唤醒 继续 执行 。 要 提醒 读者 ， 生 成 器 都 是 


异步 的 。 


其 实 ， 上 面 哆 味 了 一 堆 ， 可 以 用 代码 中 注释 的 一 句 话 来 代替 yield 
tornado.gen.sleep (17) ， 之 所 以 哆 味 ， 束 是 为 了 顺便 看 到 
tornado.gen.Task() 方 法 ， 因 为 如 果 读 者 在 看 古老 的 代码 时 会 遇 到 。 但 
是 ， 后 面 你 写 的 时 候 ， 束 不 要 那么 吵 叶 了 ， 请 用 yield 


tornado.gen.sleep()。 


至 此 ， 基 本 上 对 Tornado 的 异步 设置 有 了 概览 ， 不 过 ， 上 面 的 程序 
在 实际 中 没有 什么 价值 。 在 工程 中 ， 要 让 Tornado 网 站 真正 异步 起 来 还 
要 做 很 多 事情 ， 不 仅仅 是 如 上 面 的 设置 ， 因 为 其 实 很 多 东西 都 不 是 异步 





的 。 


在 研发 实践 中 ， 卉 步 设 置 是 比较 复杂 的 ， 不 是 简单 地 完成 上 述 流程 


束 行 了 。 比 如 以 下 各 项 中 ， 尺 管 你 已 经 完成 了 前 面 的 设置 ， 如 果 和 忽视 了 
下 面 这 些 项 目 ， 那 么 tornado 的 非 阻塞 、 异 步 优 势 削减 了 。 


数据 库 的 所 有 操作 ， 不 管 你 的 数据 是 SQL 还 是 noSQL 、connect、 
insert、update 等 。 

文件 操作 ， 打开 、 该 取 、 号 入 等。 

time.sleep， 在 前 面 举例 中 己 经 看 到 了 。 

smtplib， 发 邮件 的 操作 。 

一 些 网 络 操作 ， 比 如 tornado 的 httpclient 以 及 pycurl 等 。 


或 许 在 编程 实践 中 还 会 遇 到 其 他 的 同步 、 阻 塞 实践 。 仅 仅 就 上 面 几 








古 编程 实践 中 经 第 会 过 到 的 ， 怎 么 解决 ? 


聪明 的 大 牛 程序 员 帮 我 们 做 了 扩展 模块 ， 专 门 用 来 实现 异步 / 非 阻 





在 数据 库 方 面 ， 由 于 种 类 霉 多， 不 能 一 一 说 明 ， 比 如 MySQL， 可 
以 使 用 adb 模 块 来 实现 Python 的 异步 MySQL 库 ; 对 于 mongodb 数 据 
库 ， 有 一 个 非常 优秀 的 模块 ， 专 门 用 于 在 Tormado 和 mongodb 上 实现 
异步 操作 ， 它 就 是 motor。 下 面 特别 贴 出 它 的 Logo。 

文件 操作 方面 也 没有 奉 代 模块 ， 只 能 尽量 控制 好 IO， 或 者 使 用 内 存 
型 (Redis) 及 文档 型 (MongoDB ) 数据 库 。 

time.sleepO 在 Tornado 中 有 蔡 代 : tornado.gen.sleep0 或 者 
tornado.ioloop.IOLoop.instance().add_timeout， 这 在 前 面 代码 已 经 显 
大 Js 

smtp 发 送 邮 件 ， 推 荐 改 为 tornado-smtp-client。 

对 于 网 络 操作 ， 要 使 用 tornado.httpclient.AsyncHTTPClient。 








其 他 的 解雇 方法， 只 能 看 到 问题 具体 说 了 ， 甚 至 没有 很 好 的 解决 方 
法 。 不 过 ， 这 里 有 一 个 列表 ， 列 出 了 足够 多 的 库 ， 供 使 用 者 选择 : 
Async Client Libraries built on 
tornado.ioloop (https://github.com/tornadoweb/tornado/wiki/Links) ， 同 时 
这 个 页 面 里 面 还 有 很 多 别 的 链接 ， 都 是 很 好 的 资源 ， 建 议 读者 多 看 看 。 


到 这 里 ， 请 读者 思考 一 个 问题 ， 既 然 对 于 mongodb 有 专门 的 motor 库 
来 实现 异步 ， 前 面 对 于 Tornado 的 异步 ， 不 管 是 哪个 装饰 器 ， 都 感觉 肪 
烦 ， 有 没有 专门 的 库 来 实现 这 种 异步 呢 ?” 这 不 是 异想天开 ， 还 真有 。 也 
应 该 有 ， 因 为 这 才 体 现 Python 的 特点 。 比 如 greenlet- 
tornado (https://github.com/mopub/greenlet-tornado) 就 是 一 个 不 错 的 
库 。 读 者 可 以 浏览 官方 网 站 深入 了 解 。 


必须 声明 ， 前 面 演示 如 何在 Tornado 中 设置 异步 的 代码 ， 仅 仅 是 演 
示 设 置 方法 。 在 工程 实践 中 ， 那 个 代码 的 意义 不 大 ， 为 此 ， 应 该 有 一 个 
近似 于 实践 的 代码 示例 。 是 的 ， 的 确 应 该 有 。 当 我 正 要 写 这 样 的 代码 
时 ， 在 网 上 发 现 一 篇 文章 ， 这 篇 文章 阻止 了 我 写 下 去 ， 因 为 我 要 写 的 内 


























容 那 篇 文章 的 作者 早 就 写 好 了 ， 而 且 我 认为 表述 非常 到 位 ， 示 例 也 详 
细 。 所 以 ， 我 不 得 不 放弃 ， 转 而 推荐 给 读者 这 篇 好 文章 : 


http://emptysqua.re/blog/refactoring-tornado-coroutines/。 


有 朋友 问 ，Python 在 哪个 方面 能 让 我 感到 最 强悍 ? 我 回答 : 计算 。 
如 果 说 仅仅 要 做 一 个 实现 增删 改 查 功 能 的 网 站 ，PHP 也 是 很 好 的 选择 ， 
Python 也 没有 什么 太 让 人 惊叹 的 表现 。 但 若 要 进行 计算 ， 特 别 是 在 数据 
分 析 、 机 器 学 习 等 方面 ，Python 的 表现 会 让 人 佩服 得 五 体 投 地 。 


因为 本 书 的 读者 是 初学 者 ， 这 里 所 谓 的 “科学 计算 ”， 仅 仅 是 给 读者 
展示 一 个 简单 的 样子 ， 要 专业 研究 用 Python 进行 科学 计算 ， 还 请 读者 参 
六 有 关 专 门 的 书籍 。 





9.1 为 计算 做 准备 


9.1.1 闲谈 





计算 机 寻 女 是 擅长 进行 科学 计算 的 ， 本 来 她 就 是 做 这 个 的 ， 只 不 过 
后 来 人 们 让 她 处 理 了 很 多 文字 内 容 罢 了， 乃至 于 现在 有 一 些 人 认为 她 是 
用 来 打字 写 文 章 的 ， 却 态 记 了 她 最 擅长 的 计算 。 


每 种 编程 语言 都 能 用 来 做 计算 ， 区 别 是 在 编程 过 程 中 是 否 有 足够 的 
工具 包 供 给 。 比 如 ， 用 汇编 就 得 目 己 多 苑 动 ， 如 果 用 Fortran， 就 方便 多 
了 。 不 知道 读者 是 否 听 说 过 Fortran， 貌 似 古 老 ， 但 现在 仍 被 使 用 (以 下 
引文 均 来 目 维 基 百 科 )。 


Fortran 语 言 是 为 了 满足 数值 计算 的 需求 而 发 展 出 来 的 。1953 年 12 
月 ，IBM 公 司 工 程 师 约翰 : 巴 科 斯 (J.Backus) 因 深 深 体会 编写 程序 很 困 
难 ， 而 写 了 一 份 备忘录 给 董事 长 斯 伯 特 : 赫 德 Cuthbert Hurd) ， 建 议 为 
IBM704 系 统 设计 全 新 的 计算 机 语言 以 提升 开发 效率 。 当 时 IBM 公 司 的 
顾问 汉 : 诡 伊 曼 强烈 反对 ， 因 为 他 认为 不 切实 际 而 且 根 本 不 必要 。 但 区 
德 批准 了 这 项 计划 。1957 年 ，IBM 公 司 开 发 出 第 一 套 Fortran 语 言 ， 在 
IBM704 计 算 机 上 运作 。 历 史上 第 一 文 Fortran 程 序 在 马里 兰州 的 西屋 贝 
地 斯 核电 三 试验 。1957 年 4 月 20 日 星期 五 的 下 午 ， 一 位 IBM 软 件 工程 师 
决定 在 电厂 内 编译 第 一 支 Fortran 程 序 ， 当 程序 代码 输入 后 ， 经 过 编译 ， 
打印 机 列 出 一 行 讯息 : “原始 程序 错误 ...... 右 侧 括号 后 面 没 有 逗号 ”， 这 
让 现场 人 员 都 感到 惊讶 ， 修 正 这 个 错误 后 ， 打 印 机 输出 了 正确 结果 。 而 
西屋 电气 公司 因此 意外 地 成 为 Fortran 的 第 一 个 商业 用 户 。1958 年 推出 
Fortran I[ ， 几 年 后 又 推出 FortranIII， 在 1962 年 推出 FortranJIV 后 ， 开 始 被 
广泛 使 用 。 目 前 最 新 版 是 Fortran 2008 。 


还 有 一 个 被 广 为 应 用 的 语言 不 得 不 说 ， 那 束 是 MATLAB， 一 直 以 
来 被 人 称赞 。 


MATLAB (和 矩阵 实验 室 ) 是 MATrix LABoratory 的 缩写 ， 是 一 款 由 
美国 The MathWorks 公 司 出 品 的 商业 数学 软件 。MATLAB 是 一 种 用 于 算 


















































法 开发 、 数 据 可 视 化 、 数 据 分 析 以 及 数值 计算 的 高 级 技术 计算 语言 和 交 
互 式 环境 。 除 了 和 窍 阵 运算 、 绘 制 函数 /数据 图 像 等 常用 功能 外 ， 
MATLAB 还 可 以 用 来 创建 用 户 界面 及 调用 其 他 语言 (包括 C、C++、 
Java、Python 和 Fortran) 编写 的 程序 。 


但 是 ， 它 是 收费 的 商业 软件 ， 虽 然 在 个 别 国家 并 不 受到 收费 影响 。 
还 有 R 语 言 ， 也 是 在 计算 领域 被 广泛 使 用 的 。 


Ri 语言 ， 一 种 自由 软件 程序 语言 与 操作 环境 ， 主 要 用 于 统计 分 析 、 
绘图 、 数 据 挖 气 。R 本 来 是 由 来 自 新 西 兰 奥克兰 大 学 的 Ross Ihaka 和 
Robert Gentleman 开 发 〈 也 因此 称 为 R) ， 现 在 由 “R 开 发 核心 团队 ”负责 
开发 。R 是 基于 S 语 言 的 一 个 GNU 计 划 项 目 ， 所 以 也 可 以 当 作 S 语 言 的 一 
种 实现 ， 通 常用 S$ 语言 编写 的 代码 都 可 以 不 做 修改 地 在 R 环 境 下 运行 。R 
的 语法 是 来 自 Scheme。 


最 后 要 说 的 就 是 Python， 近 几 年 使 用 Python 的 领域 不 断 扩张 ， 包括 
在 科学 计算 领域 ， 它 已 经 成 为 了 一 种 趋势 。 在 这 个 过 程 中 ， 虽 然 有 不 少 
人 诉 病 Python 慢 、 解 释 动 态 语言 之 类 《这 种 说 法 是 值得 讨论 的 ) ， 但 依 
然 无 法 阻挡 Python 在 科学 计算 领域 大 行 其 道 。 之 所 以 这 样 ， 惑 是 因为 它 
是 Python， 天 生 骄 傲 。 


。 开源 ， 就 这 一 条 已 经 足够 了 ， 一 定 要 用 开源 的 东西 。 
。 2 所 以 有 非常 棱 的 社区 ， 里 面 有 相当 多 文 持 科学 计算 的 





























简单 易学 ， 这 一 点 对 那些 不 是 专业 的 程序 员 来 讲 非常 重要 。 接 触 过 
一 些 搞 天 文学 和 生物 学 的 研究 者 ， 他 们 也 正在 使 用 Python 进行 计 


算 。 
0 能 够 让 数据 与 其 他 领域 比如 Web 无 
对 按 。 


当然 ， 最 重要 一 点 是 本 书 是 讲 Python 的 ， 所 以 ， 在 科学 计算 这 块 肯 
定 不 会 讲 Fortran 或 者 R， 而 是 会 讲 Python。 





9.1.2” 安装 


如 果 读 者 使 用 Ubuntu 或 者 Debian， 可 以 这 样 来 安装 : 


sudo apt-get install python-numpy python-scipy python-matplotlib 
ipython ipython-notebook python-pandas python-sympy python-nose 


一 股 脑 把 可 能 用 上 的 都 先 装 上 。 在 安装 的 时 候 ， 如 果 需 要 其 他 依 
赖 ， 你 会 明显 看 到 的 。 


如 果 是 别 的 系统 ， 比 如 Windows， 请 自己 去 网 上 查找 安装 方法 吧 ， 
最 权威 的 是 看 官方 网 站 列 出 的 安 闭 : http://www.scipy.org/install.html。 





9.1.3 ”基本 操作 


在 科学 计算 中 ， 业 界 比较 喜欢 使 用 ipython notebook， 前 面 已 经 有 安 
装 。 在 shell 中 执行 : 


ipython notebook--pylab=inline 


得 到 如 图 9-1 所 示 的 界面 ， 这 是 在 浏览 占 中 打开 的 。 
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图 9-1 在 浏览 器 中 打开 界面 


在 mn 后 面 的 编辑 区 ， 可 以 写 Python 语 句 。 然 后 按 下 SHIFT+ENTER 
或 者 CTRL+ENTER 组 合 键 束 能 执行 了 ， 如 果 按 下 ENTER 键 ， 则 不 是 执 
行 ， 而 是 在 当前 编辑 区 换行 。 


Ipython Notebook 有 是 一 个 非常 不 错 的 编辑 器 ， 执 行 之 后 ， 直 接 显示 
出 来 输入 的 内 容 和 输出 的 结果 。 当 然 ， 错 误 是 难免 的 ， 如 图 9-2 所 示 。 


TypeError Traceback (most recent call last) 
/home/qw/Documents/StarterLearningPython/<ipython-input-9-44c3f4788939> in <module> 
1 import random 


> 23= [random.randint([19)] 
3 print a 


TypeError: randint() takes exactly 3 arguments (2 given) 








图 9-2 显示 内 容 


注意 观察 图 中 的 第 涉 所 指 ， 直 接 标 出 有 问题 的 行 。 人 返回 编辑 区 ， 修 
改 之 后 可 继续 执行 。 


不 要 忽视 左边 的 辅助 操作 ， 它 能 够 让 你 在 使 用 ipython notebook 的 时 
候 更 方便 ， 如 图 9-3 所 示 。 
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图 9-3 左边 的 辅助 操作 


除了 在 网 页 中 之 外 ， 如 宁 你 已 经 喜欢 上 了 Python 的 交互 模式 ， 特 别 
是 你 用 的 计算 机 中 有 shell， 那 就 更 棒 了 。 于 是 可 以 : 





$ ipython 


进入 了 一 个 类 似 于 Python 的 交互 模式 中 ， 如 下 所 示 : 
In [1]: print "hello, pandas" 
hello, pandas 


In [2]: 


或 者 说 ipython 同 样 是 一 个 不 错 的 交互 模式 。 


9.2 Pandas 


Pandas 是 基于 NumpPy 的 一 个 非常 好 用 的 库 ， 正 如 名 字 一 样 ， 人 见 人 
爱 。 之 所 以 如 此 ， 是 因为 不 论 是 读 取 还 是 处 理 数 据 ， 用 它 都 非常 简单 。 





9.2.1 基本 的 数据 结构 








Pandas 有 两 种 目 己 独 有 的 基本 数据 结构 。 读 者 应 该 注意 的 是 ， 它 回 
然 有 着 两 种 数据 结构 ， 因 为 它 依然 是 Python 的 一 个 库 ， 所 以 ，Python 中 
有 的 数据 类 型 在 这 里 依然 适用 ， 同 样 还 可 以 使 用 类 上 自己 定义 数据 类 型 。 
不 过 ，Pandas 里 面 又 定义 了 两 种 数据 类 型 : Series 和 DataFrame， 它 们 让 
数据 操作 更 简单 。 


以 下 操作 都 是 基于 如 下 模块 导入 : 


In [1]: from pandas Import Series, DataFrame 
Import pandas as pd 





为 了 省 事 ， 后 面 束 不 再 显示 了 。 如 果 你 跟 我 一 样 是 使 用 的 ipython 
notebook， 只 需要 开始 引入 模块 即 可 。 


e Series 


Series 如 同 列表 一 样 ， 有 一 系列 数据 ， 每 个 数据 对 应 一 个 索引 值 。 
比如 这 样 一 个 列表 : [9，3，8]， 如 果 跟 索引 值 写 到 一 起 ， 束 是 : 








这 种 样式 我 们 已 经 熟悉 了， 不 过 ， 有 些 时 候 需 要 把 它 竖 过 来 表示 : 

















上 面 两 种 ， 只 是 表现 形式 上 的 差别 罢了 。 
Series 就 是 “ 竖 起 来 ”的 list: 
In [2]: s = Series([1860, "PYTHON", "Soochow", "Qiwsir"]) 
S 


Out[2]: 


0 
1 
2 Soochow 
3 





另外 一 点 也 很 像 列表 ， 束 是 其 中 元 系 的 类 型 由 你 任意 决定 〈 其 实 是 
由 需要 来 决定 ) 。 


这 样 ， 我 们 就 创建 了 一 个 Series 对 象 ， 这 个 对 象 有 其 属性 和 方法 。 
比如 ， 下 面 的 两 个 属性 依次 可 以 显示 Series 对 象 的 数据 值 和 索引 : 





In [3]: Ss .WLW 
Out[3]: array([160, 'PYTHON', 'Soochow', 'Qiwsir'], dtype=object) 
En EA]: ss 


Out[4]: Int64Index([9, 1, 2, 3], dtype=int64) 





列表 的 索引 只 能 是 从 0 开始 的 整数 ， 在 默认 情况 下 ，Series 数 据 类 型 
其 索引 也 是 如 此 。 但 区 别 于 列表 的 是 ，Series 可 以 目 定 义 索 引 : 








52 = Series([169， "PYTHON", "Soochow", "Qiwsir"], index=["mark", "title", "university", "name"]) 
52 

mark 169 

title PYTHON 

university Soochow 

name Qiwsir 








每 个 元 么 都 有 了 索引 ， 就 可 以 根据 索引 操作 元 素 了 。 还 记得 list 中 
的 操作 吗 ? 在 Series 中 也 有 类 似 的 操作 。 先 看 简单 的 ， 根 据 索 引 查 看 其 
值 和 修改 其 值 : 


En LA 





Out[7]: ‘Qiwsir' 


ri [8]: 

In [9]: 

Out[9]: mark 109 
title PYTHON 
university Soochow 
name AOI 





这 是 不 是 又 有 扩 类 似 dict 数 据 ? 的 确 如 此 ， 看 下 面 就 理解 了 。 


前 面 定 义 Series 对 象 的 时 候 ， 用 的 是 列表 ， 即 Series(0) 方 法 的 参数 中 
第 一 个 列表 就 是 其 数据 值 ， 如 果 需 要 定义 index， 放 在 后 面 依然 是 一 个 
列表 。 除 了 这 种 方法 之 外 ， 还 可 以 用 下 面 的 方法 定义 Series 对 象 : 


In [15]: sd = {"python":8000, "c++":8100, "Cc#":4000} 
s4 = Series(sd) 
s4 


Out[15]: Cc# 4000 
C 十 十 8100 
python 8000 


现在 是 否 理 解 为 什么 前 面 那个 类 似 dict 了? 因为 本 来 束 是 可 以 这 样 
定义 的 。 
这 时 候 ， 索 引 依然 可 以 自 定义 。Pandas 的 优势 在 这 里 体现 出 来 ， 如 


果 自 定义 了 索引 ， 自 定义 的 索引 会 自动 寻找 原来 的 索引 。 如 果 一 样 ， 就 
取 原 来 索引 对 应 的 值 ， 这 个 可 以 简称 为 “自动 对 齐 ”。 














In [19]: s6 = Series(sd, index=["java","python","c++","c#"]) 


S6 

Out[19]: java NaN 
python 86069 
C++ 8109 
C# 4000 


在 sd 中 ， 只 有 “python':8000，'c++':8100，'c#:4000”， 没 有 “java”， 
但 是 在 索引 参数 中 有 ， 于 是 其 他 能 够 “自动 对 齐 ” 的 照搬 原 值 ， 没 有 的 那 
个 *java” 依 然 在 新 Series 对 象 的 索引 中 存在 ， 并 且 目 动 为 其 赋值 NaN。 在 
Pandas 中 ， 如 果 没 有 值 ， 都 对 齐 赋 给 NaN。 下 面 来 一 个 更 特殊 的 : 


In [17]: lrlst = I av pert 
s5 = Series(sd,index=ilst) 
s5 


Out[17]: java NaN 
perl NaN 





新 得 到 的 Series 对 象 索引 与 sd 对 象 一 个 也 不 对 应 ， 所 以 都 是 NaN。 
Pandas 有 专门 的 方法 来 判断 值 是 否 为 空 。 


In [26]: pd.isnuLL(S6) 


Out[20]: java True 
python False 
C+ 十 False 
C# False 


In [21]: pd.notnull(s6)| 


Out[21]: java False 
python True 
C++ True 


C# True 


此 外 ，Series 对 象 也 有 同样 的 方法 : 


In [22]: EEE) 


Out[22]: java True 
python False 
C++ False 
C# False 


其 实 ， 对 索引 的 名 字 是 可 以 重新 定义 的 : 


In [38]: ls6asindex ss [DR “p27 "pa "pa 


s6 
out[38]: pl NaN 
p2 8000 
p3 8169 
p4 4000 


对 于 Series 数 据 ， 也 可 以 做 类 似 下 面 的 运算 : 


In [16] : IS3 = Series{([l3 9 4 071 indexelar "be sd ly 
S3 


Out[10] : 


CNTo 
局 上 四 


In [11]: | 名 [3 51 


Out[11]: b 9 
d 7 

In [2 

Out[12]: a 二 号 
b 45 
C 20 
d 35 


上 面 的 演示 都 是 在 ipython notebook 中 进行 的 ， 所 以 截图 了 。 在 学 习 
Series 数 据 类 型 的 同时 了 解 了 ipyton notebook。 对 于 后 面 的 所 有 操作 ， 读 


者 都 可 以 在 ipython notebook 中 进行 ， 也 可 以 在 Python 交互 模式 中 进行 。 
e DataFrame 


DataFrame 是 一 种 二 维 的 数据 结构 ， 非 党 接近 于 电子 表格 或 者 类 似 
MySQL 数 据 库 的 形式 。 它 的 竖 行 称 之 为 columns， 横 行 跟前 面 的 Series 一 
样 ， 称 之 为 index， 也 束 是 说 可 以 通过 columns 和 index 来 确定 一 个 主 句 的 
位 置 。 





c4 -可 Columns 





index 


下 面 的 澳 示 在 Python 交互 模式 下 进行 ， 读 者 仍然 可 以 在 ipython 
notebook 环 境 中 测试 。 
>>> import pandas as pd 
>>> from pandas import Series, DataFrame 


>>> data = {f"name":["yahoo"，"google"，"facebook"]，"marks":[200,400,800]，"price":[9 
>>> f1 = DataFrame(data) 


>>> f1 
marks name price 
0 200 yahoo 9 


1 400 google 3 
2 800 facebook 7 


这 是 定义 一 个 DataFrame 对 象 的 常用 方法 一 一 使 用 dict 定 义 。 字 ~ 典 
的 “ 键 ”("name"，"marks"，"price") 就 是 DataFrame 的 columns 的 值 ( 名 
称 ) ， 字 上 典 中 每 个 “ 键 ” 的 “ 值 ” 是 一 个 列表 ， 它 们 就 是 那 一 坚 列 中 的 填充 
数据 。 上 面 的 定义 中 没有 确定 索引 ， 所 以 ， 按 照 惯例 〈Series 中 已 经 形 
成 的 惯例 ) 就 是 从 0 开始 的 整数 。 从 上 面 的 结果 中 很 明显 表示 出 来 ， 这 
就 是 一 个 二 维 的 数据 结构 〈 类 似 Excel 或 者 MySQL 中 的 查看 效果 ) 。 


上 面 的 数据 显示 中 ，columns 的 顺序 没有 规定 ， 就 如 同 字 典 中 键 的 
顺序 一 样 ， 但 是 在 DataFrame 中 ，columns 跟 字典 键 相 比 ， 有 一 个 明显 不 
同 ， 就 是 其 顺序 可 以 被 规定 ， 如 下 所 示 : 








>>> f2 = DataFrame(data, columns=['name', 'price', 'marks']) 


>>> f2 
name price marks 
0 yahoo 9 200 
1 google 3 400 
2 


facebook 7 800 


跟 Series 类 似 ，DataFrame 数 据 的 索引 也 能 够 自 定义 。 


>>> f3 = DataFrame(data, columns=['name', 'price', 'marks', 'debt'], index=['a','b’ 
Traceback (most recent call last): 
File "<stdin>", line 1, in <module> 
File "/usr/lib/pymodules/python2.7/pandas/core/frame.py", line 283, in _ init _ 
mgr = self. init dict(data, index, columns, dtype=dtype) 
File "/usr/lib/pymodules/python2.7/pandas/core/frame.py", line 368, in _init_ dict 
mgr = BlockManager (blocks, axes) 
File "/usr/lib/pymodules/python2.7/pandas/core/internals.py", line 285, in _ init 
self._verify_integrity() 
File "/usr/lib/pymodules/python2.7/pandas/core/internals.py", line 367, in _verif 
assert(block.values.shape[1:] == mgr_shape[1:]) 
ASssertionError 





报错 了 。 这 个 报错 信息 太 不 友好 了， 也 没有 提供 什么 线索 ， 这 束 是 
交互 模式 的 不 利之 处 。 修 改 之 ， 错 误 在 于 index 的 值 一 一 列表 ， 其 数据 
项 多 了 一 个 ，data 中 是 三 行 ， 这 里 给 出 了 四 个 项 (['a, 'b', 'c', 'd']) 。 


>>> f3 = DataFrame(data, columns=['name', 'price', 'marks', 'debt'], index=['a','b’ 
>>> f3 
name price marks debt 
a yahoo 9 200 NaN 
b google 3 400 NaN 


c facebook 7 800 NaN 








读者 还 要 注意 观察 上 面 的 显示 结果 。 因 为 在 定义 f3 的 时 候 ， 
columns 的 参数 中 比 以 往 多 了 一 项 (debt) ， 但 是 这 项 在 data 这 个 字典 中 
并 没有 ， 所 以 debt 这 一 紧 列 的 值 都 是 空 鸭 ， 在 Pandas 中 ， 衬 就 用 NaN 来 
代表 了 。 


定义 DataFrame 的 方法 ， 还 可 以 使 用 “字典 套 字 典 ” 的 方式 。 








>>> newdata = {"lang":{"firstline":"python","secondline":"java"}, "price":{"firstl1i 
>>> f4 = DataFrame(newdata) 


>>> f4 
lang price 
firstline python 8000 


secondline java NaN 


在 字典 中 束 规 定好 数列 名 称 (第 一 层 键 ) 和 每 模 行 索 引 (第 二 层 字 


典 键 ) 以 及 对 应 的 数据 《第 二 层 字典 值 ) ， 即 在 字典 中 规定 好 每 个 数据 
格子 中 的 数据 ， 没 有 规定 的 都 是 空 。 





>>> DataFrame(newdata, index=["firstline","secondline","thirdline"]) 


lang price 
firstline python 8000 
secondline java NaN 
thirdline NaN NaN 


如 条 额 外 确定 了 索引 ， 就 如 同上 面 显示 的 一 样 ， 除 非 在 字典 中 有 相 
应 的 索引 内 容 ， 人 否则 都 是 NaN。 


前 面 定义 了 DataFrame 数 据 ， 它 也 是 一 种 对 象 类 型 ， 比 如 变量 f3 引 
用 了 一 个 对 象 ， 它 的 类 型 是 DataFrame。 承 接 以 前 的 思维 方法 : 对 象 有 
属性 和 方法 。 





>>> f3.columns 
Index(['name', 'price', 'marks', 'debt'], dtype=object) 


DataFrame 对 象 的 columns 属 性 能 够 显示 素 有 的 columns 名 称 ， 并 
日， 还 能 用 下 面 类 似 字 上 典 的 方式 得 到 某 竖 列 的 全 部 内 容 (当然 包含 索 
5|): 








>>> f3['name'] 


a yahoo 
b google 
c facebook 


Name: name 


这 其 实 就 是 一 个 Series， 或 者 说 ， 可 以 将 DataFrame 理 解 为 是 由 一 个 
一 个 的 Series 组 成 的 。 


一直 耿 耿 于 怀 没有 数值 的 那 一 列 ， 下 面 的 操作 是 统一 给 那 一 列 





>>> f3['debt'] = 89.2 


>>> f3 

name price marks debt 
a yahoo 9 200 89.2 
b google 3 400 89.2 
c facebook 7 800 89.2 


除了 能 够 统一 赋值 之 外 ， 还 能 够 < 点 对 点 ”添加 数值 ， 结 合 前 面 的 


Series， 既 然 DataFrame 对 象 的 每 紧 列 都 是 一 个 Series 对 象 ， 那 么 可 以 先 
定义 一 个 Series 对 象 ， 然 后 把 它 放 到 DataFrame 对 象 中 。 如 下 : 


>>> sdebt = Series([2.2, 3.3], index=["a","c"]) # 注 意 索 引 





>>> f3['debt'] = sdebt 


将 Series 对 象 (sdebt 变 量 所 引用 〉 赋 给 f3['debt"] 列 ，Pandas 的 一 个 重 
要 特性 上 自动 对 齐 ， 在 这 里 起 做 用 了 ， 在 Series 中 ， 只 有 两 个 索引 
Ca"，"c") ， 它 们 将 和 DataFrame 中 的 索引 自动 对 齐 。 于 是 平 : 

















>>> f3 


name price marks debt 
a yahoo 9 200 2.2 
b google 3 400 NaN 
c facebook 7 800 3.3 


目 动 对 齐 之 后 ， 没 有 被 复制 的 依然 保持 NaN。 
还 可 以 更 精准 地 修改 数据 吗 ? 当然 可 以 ， 完 全 仿照 字典 的 操作 : 


>>> f3["price"]["c"]= 300 
>>> f3 

name price marks debt 
a yahoo 9 200 2.2 
b google 3 400 NaN 
c facebook 300 800 3.3 


这 些 操作 是 不 是 都 不 卫生 ? 这 束 是 Pandas 中 的 两 种 数据 对 象 。 
9.2.2 ” 读 取 CSV 文 件 


因为 篇 幅 限 制 ， 不 能 将 有 关 Pandas 的 内 容 完全 详细 讲述 ， 只 能 “ 抛 
砖 引 玉 ”， 向 大 家 做 一 个 简单 介绍 ， 说 明 其 基本 使 用 方法 。 当 读者 在 实 
J 如 果 明 到 问题 ， 可 以 结合 相关 文档 或 者 通过 搜索 来 解 
快 。 


1. 关 于 CSV 文 件 


CSV 是 一 种 通用 的 、 相 对 简单 的 文件 格式 ， 在 表格 类 型 的 数据 中 用 
途 很 广泛 ， 很 多 关系 型 数据 库 都 文 持 这 种 类 型 文件 的 导入 导出 ， 并 且 
Excel 这 种 常用 的 数据 表格 也 能 和 CSV 文 件 之 间 转 换 。 


喜 号 分 隔 值 (Comma-Separated Values，CSV， 有 时 也 称 为 字符 分 
隔 值 ， 因 为 分 隔 字符 也 可 以 不 是 逗号 ) ， 其 文件 以 纯 文 本 形式 存储 表格 
数据 (数字 和 文本 ) 。 纯 文本 意味 着 该 文件 是 一 个 字符 序列 ， 不 含 必 须 
像 二 进 制 数字 那样 被 解读 的 数据 。CSV 文 件 由 任意 数目 的 记录 组 成 ， 记 
录 间 以 某 种 换行 符 分 隔 ; 每 条 记录 由 字段 组 成 ， 字 段 间 的 分 隔 符 是 其 他 
字符 或 字符 串 ， 最 第 见 的 是 逗号 或 制 表 符 。 通 常 ， 所 有 记录 都 有 完全 相 
同 的 字段 序列 。 


从 上 述 维基 百科 的 叙述 中 ， 重 点 要 解读 出 “字段 间 分 隔 符 ?和 "最 帝 
见 的 是 逗号 或 制 表 符 ”， 当 然 ， 这 种 分 隔 符 也 可 以 自行 制定 。 比 如 下 面 
这 个 我 命名 为 marks.csv 的 文件 ， 就 是 用 去 号 〈 必 须 是 半角 的 ) 作为 分 隔 
符 : 









































name, physics, python,math, english 
Google, 100, 100, 25, 12 
Facebook, 45, 54, 44, 88 

Twitter, 54,76,13,91 

Yahoo, 54, 452, 26, 100 


其 实 ， 这 个 文件 要 表达 的 事情 是 (如 果 转 化 为 表格 形式 ): 


丰 B 局 D | E 
nanme physics python math eneglish 
Google 100 100 


Facebook 49 od 
Twitter 94 了 
Yahoo 5 492 








最 简单 、 最 直接 的 就 是 用 open0 打 开 文 件 : 


>>> with open("./marks.csv") as f: 
es for line in f: 
print line 


name, physics, python,math, english 


Google, 100, 100, 25, 12 
Facebook, 45, 54, 44, 88 
Twitter, 54,76,13,91 


Yahoo, 54, 452, 26, 100 


此 方法 可 以 ， 但 略 显 抹 烦 。 


Python 中 还 有 一 个 CSV 的 标准 库 ， 足 可 见 CSV 文 件 的 使 用 频繁 了 。 


>>> import csv 
>>> dir(csv) 


['Dialect', 'DictReader', 'DictWriter', 'Error', 'QUOTE ALL', 'QUOTE_ MINIMAL', 


什么 时 候 也 不 要 起 记 这 种 最 佳 学 习 方 法 。 从 上 和 面 的 结果 可 以 看 出 


CSV 模 块 提供 的 属性 和 方法 。 仪 仅 就 读 取 本 例子 中 的 文件 : 


>>> import csv 
>>> csv_reader = csv.reader(open("./marks.csv")) 
>>> for row in csv_reader: 

print row 


['name', 'physics', 'python', 'math', 'english'] 
['Google', '100', '100', '25', '12'] 
['Facebook', '45', '54', '44', '88'] 

['Twitter', '54', '76', '13', '91'] 

['Yahoo', '54', '452', '26', '100'] 








算是 稍 有 改善 。 
如 果 对 上 面 的 结果 都 不 满意 的 话 ， 那 么 看 看 Pandas 的 效 末 : 


>>> import pandas as pd 
>>> marks = pd.read csv("./marks.csv") 


>>> marks 

name physics python math english 
0 Google 100 100 25 12 
1 Facebook 45 54 44 88 
2 Twitter 54 76 13 91 
3 Yahoo 54 452 26 100 


'QUO 


看 了 这 样 的 结果 ， 你 还 不 感到 惊讶 吗 ? 你 还 不 喜欢 Pandas 吗 ? 这 是 


多 么 精妙 的 显示 ， 它 就 是 一 个 DataFrame 数 据 。 


还 有 另外 一 种 方法 : 


>>> pd.read_ table("./marks.csv", sep=",") 
name physics python math english 


0 Google 100 100 25 12 
1 Facebook 45 54 44 88 
2 Twitter 54 76 13 91 
3 


Yahoo 54 452 26 100 





如 果 你 有 足够 的 好 奇 心 来 研究 这 个 名 叫 DataFrame 的 对 象 ， 可 以 这 


>>> dir(marks) 
['T', '_AXIS ALIASES', '_AXIS NAMES', '_AXIS NUMBERS', '_ add ', '_and ', '_ arr 





一 个 一 个 浏览 一 下 ， 通 过 名 字 可 以 知道 那个 方法 或 者 属性 的 大 概 ， 
然后 就 可 以 根据 你 自己 的 喜好 和 需要 ， 试 一 试 : 








>>> marks.index 

Int64Index([0, 1, 2, 3], dtype=int64) 

>>> marks.columns 

Index([name, physics, python, math, english], dtype=object) 
>>> marks['name'][1] 

"Facebook' 





这 几 个 是 让 你 回忆 一 下 前 面 的 。 从 DataFrame 对 象 的 属性 和 方法 中 
找 一 个 ， 再 尝试 : 


>>> marks.sort(column="python") 
name physics python math english 


1 Facebook 45 54 44 88 
2 Twitter 54 76 13 91 
0 Google 100 100 25 12 
3 Yahoo 54 452 26 100 


按照 竖 列 “python” 的 值 排队 ， 结 果 也 是 很 让 人 满意 的 。 下 面 几 个 操 
作 ， 也 是 常用 到 的 ， 并 且 秉 承 了 Python 的 一 贯 方法 : 


>>> marks[:1] 
name physics python math english 
9 Google 100 100 25 12 
>>> marks[1:2] 
name physics python math english 


1 Facebook 45 54 44 88 
>>> marks["physics"] 

0 100 

工 45 

2 54 

3 54 


Name: physics 





可 以 说 ， 当 你 已 经 掌握 了 通过 dir0 和 help0O 查 看 对 象 的 方法 和 属性 
时 ， 就 已 经 掌握 了 Pandas 的 用 法 ， 其 实 何 止 Pandas， 其 他 对 象 都 是 如 


ls 


2. 读 取 其 他 格式 数据 


CSV 是 常用 来 存储 数据 的 格式 之 一 ， 此 外 常用 的 还 有 MS Excel 格 式 
的 文件 ， 以 及 JSON 和 XML 格式 的 数据 等 ， 它 们 都 可 以 使 用 Pandas 来 轻 


易 读 取 。 


在 下 面 的 结果 中 寻 况 一 下 ， 有 没有 跟 Excel 有 关 的 方法 。 


>>> dir(pd) 


['DataFrame', 


'DataMatrix', 


'Dateoffset', 


"DateRange '， 


'ExcelFile', 'ExcelWriter' 


虽然 没有 类 似 read_csv0 的 方法 ， 但 是 有 ExcelFile 类 ， 于 是 平 : 


>>> xls = pd.ExcelFile("./marks.xlsx") 


Traceback (most recent call last): 
File "<stdin>", 
File "/usr/lib/pymodules/python2.7/pandas/io/parsers.py", line 575, in _ init _ 


from openpyxl1 import load workbook 
ImportError: No module named openpyxl1 


line 1, in <module> 


了 


我 这 里 少 了 一 个 模块 ， 看 报错 提示 ， 用 pip 安 装 openpyXxl 模 块 : sudo 
pip install openpyxl。 继 续 : 


>>> XJSsS = pd.ExcelFile("./marks.xlsx") 


>>> dir(xls 
['" class 


) 


1 
了 


d 





elattr  '，， 


dict 


1 
了 


doc 


7 





>>> xls.sheet_ names 
'Sheet2', 'Sheet3'] 


['Sheet1', 


>>> sheet1 = xls.parse("Sheet1") 


>>> sheet1 


0 工 
0 5 100 
1 6 45 
2 7 54 
3 8 54 


2 
100 
54 
76 
452 


3 
25 
44 
13 
26 


4 
12 
88 
91 

100 


format _', 


'__getattribute 


结果 中 ，columns 的 名 字 与 前 面 CSV 结 果 不 一 样 ， 数 据 部 分 是 同样 
的 结果 。 从 结果 中 可 以 看 到 ，sheetl 也 是 一 个 DataFrame 对 象 。 


对 于 单个 的 DataFrame 对 象 ， 如 何 通 过 属性 和 方法 进行 操作 ? 如 果 





读者 理解 了 本 书 从 一 开始 就 贯穿 进来 的 思想 jj 用 dirO0 和 help0 或 者 到 
官方 网 站 看 文档 一 一 此 时 就 能 比较 轻松 地 进行 各 种 操作 了 。 


从 数据 库 中 和 查询 出 来 的 数据 ， 也 可 以 按照 Series 或 者 DataFrame 类 型 
数据 进行 组 织 ， 然 后 就 可 以 对 其 操作 。 





9.2.3 “处理 股票 数据 


某 段 时 间 茶 国 股市 很 火爆 ， 不 少 专家 在 分 析 股 市 火爆 的 各 种 原因 ， 
不 久 ， 该 国 的 股票 又 开始 狂 跌 ， 各 种 各 样 的 救市 政策 仅仅 是 星 臂 当 车 喷 
了 。 不 过 ， 我 还 是 很 淡定 的 ， 因 为 没 钱 。 


但 是 ， 为 了 体现 本 人 也 是 与 时 俱 进 的 ， 就 以 股票 数据 为 例子 ， 来 简 
要 说 明 Pandas 和 其 他 模块 在 处 理 数据 上 的 应 用 。 





1. 下 载 YAHOO 上 的 数据 


或 许 你 好 奇 ， 为 什么 要 下 载 YAHOO 上 的 股票 数据 呢 ? 国内 网 站 上 
不 是 也 有 吗 ? 有 ， 但 我 不 喜欢 用 。 我 喜欢 YAHOO， 因 为 它 曾 经 吸引 
我 ， 注 意 我 说 的 是 www.yahoo.com。 


YAHOO!I 


虽然 YAHOO 的 有 身影 渐 行 渐 远 ， 但 它 终 究 是 值得 记忆 的 。 所 以 ， 我 
要 演示 如 何 下 载 YAHOO 财 经 栏目 中 的 股票 数据 。 

















In [1]: import pandas 
In [2]: import pandas.io.data 


In [3]: sym = "BABA" 
In [4]: finace = pandas.io.data.DataReader(sym, "yahoo", start="2014/11/11") 


In [5]: print finace.tail(3) 
Open High Low Close Volume Adj Close 


Date 

2015-06-17 86.580002 87.800003 86.480003 86.800003 10206100 86.800003 
2015-06-18 86.970001 87.589996 86.320000 86.750000 11652600 86.750000 
2015-06-19 86.510002 86.599998 85.169998 85.739998 10207100 85.739998 


下 载 了 阿里 巴巴 的 股票 数据 〈 自 2014 年 11 月 11 日 以 来 ) ， 并 且 打 印 
最 后 三 条 。 
2. 男 图 


己 经 得 到 了 一 个 DataFrame 对 象 ， 就 是 前 面 已 经 下 载 并 用 finace 变 量 
引用 的 对 象 。 





In[6]: import matplotlib.pyplot as plt 
In [7]: plt.plot(finace.index, finace["Open"]) 
Out[]: [<matplotJlib. Lines,Line2D at Oxa88e5cc>] 


In [8]: plt.show() 


结果 如 图 9-4 所 示 。 








上 由 lh l 由 上 上 
Dec 2014 jan 2015 Feb 2015 Mar 2015 Apr 2015 May 2015 Jun 2015 


图 9-4 ”阿里 巴巴 股票 数据 图 
从 图 9-4 中 可 以 看 出 阿里 巴巴 的 股票 目 从 2014 年 11 月 11 日 到 2015 年 6 


月 19 日 的 股票 开盘 价 的 变化 。 


上 面 指令 中 的 import matplotlib.pyplot as plt 是 此 前 没有 看 到 的 。 
matplotlib 模 块 是 Python 中 绘制 二 维 图 形 的 模块 ， 是 最 好 的 模块 。 可 异 
matplotlib 的 发 明 者 一 一 John Hunter 已 经 于 2012 年 8 月 28 日 因 病 医治 无 效 
碳 年 早 逝 ， 这 真是 天 妨 喘 才 呀 。 为 了 缅怀 他 ， 请 读者 访问 官方 网 站 : 
matplotlib.org (http:/matplotlib.org/) ， 并 认真 学 习 这 个 模块 的 使 用 。 

经 过 上 面 的 操作 ， 读 者 可 以 用 dir(0) 这 个 以 前 常用 的 法 宝来 查看 
finace 所 引用 的 DataFrame 对 象 的 方法 和 属性 等 。 只 要 运用 dir+help 束 能 
够 对 这 个 对 象 进行 操作 ， 也 残 是 能 够 对 该 股票 数据 进行 各 种 操作 。 

再 次 声明 ， 本 书 仅 仅 是 稍微 省 示 一 下 相关 操作 ， 如 果 读 者 要 深入 研 
习 ， 恭 请 寻找 相关 的 专业 书籍 资料 阅读 学 习 。 











